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[571 Abstract: 

Speech entering method as motor vehicle destination address in real time 
The method involves detecting the user's speech by means of a speech recognition 
device which classifies the speech according to identification probability, and 
identifies the speech with the highest probability as the entered speech. At least 
one permitted spoken word is a command which activates the system. All permitted 
words are held in a data base. 

At least one control function contains an input dialogue. At least one lexicon is 
generated from the stored words, after a control function of the system is 
activated. The lexicon is loaded into the speech recognition device as its 
vocabulary. 
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Beschreibung 

[0001] Die Erfindung betrifft ein Verfahren zur Spracheingabe einer Zieladresse in ein Zielfuhrungssystem im Echt- 
zeitbetrieb gemaG dem Oberbegriff des Patentanspruchs 1 sowie eine Vorrichtung zum Ausfuhren des Verfahrens 

5 gemaG Oberbegriff des Patentanspruchs 1 2. 

[0002] Die DE 1 96 00 700 beschreibt ein Zielfuhrunassystem fur ein Kraftfahrzeug, bei welchem als Eingabevorrich- 
tung ein fest montierter Schalter, ein Beruhrfeldschalter Oder ein Spracherkennungsgerat verwendet werden kann. 
Das Dokument geht aber nicht auf die Spracheingabe einer Zieladresse in ein Zielfuhrungssystem ein. 
[0003] Die EP 0 736 853 A1 beschreibt ebenfalls ein Zielfuhrungssystem fur ein Kraftfahrzeug. Die Spracheingabe 

w einer Zieladresse in ein Zielfuhrungssystem ist aber nicht Gegenstand dieses Dokuments. 

[0004] Die DE 36 08 497 A1 beschreibt ein Verfahren zum sprachgesteuerten Bedienen eines Fernmeldeendgerates, 
insbesondere eines Autotelefons. Als nachteilig wird an dem Verfahren angesehen, daG nicht auf die speziellen Pro- 
bleme bei der Spracheingabe einer Zieladresse in ein Zielfuhrungssystem eingegangen wird. 
[0005] Aus der JP-A-08-202386 ist ein Navigationsgerat mit einem Spracherkennungsgerat bekannt, bei dem ein 

15 Ortsnamen-Lexikon der Orte entlang einer mittels Fernbediening bestimmten Route generiert wird. 

[0006] Die JP-A-07 064 480 offenbart ein Spracherkennungsgerat fur ein Navigationssystem in einem Fahrzeug, in 
dem die Ortsnamen in Gruppen zusammengefasst sind. Die Spracherkennung arbeitet mit einem Ortsnamen-Lexikon, 
in dem die Gruppen der Ortsnamen abhangig von der Distanz zur aktuelien Position des Fahrzeugs geordnet sind. 
[0007] Die altere noch nicht vorveroffentlichte Patentanmeldung WO-A-97 1 0 583 der Anmelderin offenbart ein gat- 

20 tungsgemaGes Verfahren zur automatischen Steuerung eines oder mehrerer Gerate durch Sprachkommandos oder 
per Sprachdialog im Echtzeitbetrieb und eine Vorrichtung zum Ausfuhren des Verfahrens. GemaG diesem Verfahren 
werden die eingegebenen Sprachkommandos mittels einer Spracherkennungseinrichtung, welche einen sprecherun- 
abhangigen Spracherkenner und einen sprecherabhangigen Zusatz-Spracherkennner umfaGt, erkannt und gemaB 
ihrer Erkennungswahrscheinlichkeit als das eingegebene Sprachkommando identifiziert und die diesem Sprachkom- 

25 mando zugeordneten Funktionen des oder der Gerate initiiert. Die Sprachkommandos bzw. die Sprachdialoge werden 
dabei auf der Basis von mindestens einer Synataxstruktur, mindestens einem Basiskommandovokabular und bei Be- 
darf mindestens einem sprecherspezifischen Zusatzkommandovokabular gebildet. Die Syntaxstrukturen und die Ba- 
siskommandovokabularien werden in sprecherunabhangiger Form vorgegeben und sind wahrend des Echtzeitbetriebs 
fixiert. Das sprecherspezifischeZusatzvokabularwird vom jeweiligen Sprechereingegeben und/oder geandert, indem 

30 in Trainingsphasen innerhalb und auGerhalb des Echtzeitbetriebs ein nach einem sprecherabhangigen Erkennungs- 
verfahren arbeitenderZusatz-Spracherkenner vom jeweiligen Sprecher durch eine mindestens einmalige Eingabe der 
Zusatzkommandos auf die sprecherspezifischen Merkmale des jeweiligen Sprechers trainiert wird. Im Echtzeitbetrieb 
erfolgt die Abwicklung des Sprachdialogs und/oder die Steuerung der Gerate wie folgt: 

35 - vom Benutzer eingegebene Sprachkommandos werden einem sprecherunabhangigen und auf der Basis von Pho- 
nemen arbeitenden Spracherkenner und dem sprecherabhangigen Zusatz-Spracherkenner zugeleitet und dort 
einer Merkmalextraktion unterzogen und im sprecherabhangigen Zusatz-Spracherkenner anhand der dort extra- 
hierten Merkmale auf das Vorliegen von Zusatzkommandos aus dem Zusatzkommandovokabular untersucht und 
klassifiziert. 

40 - anschlieGend werden die als mit einer bestimmten Wahrscheinlichkeit erkannt klassifizierten Kommandos und 
Syntaxstrukturen der beiden Spracherkenner zu hypothetischen Sprachkommandos zusammengefugt und diese 
gemaG der vorgegebenen Syntaxstruktur auf ihre Zulassigkeit und Erkennungswahrscheinlichkeit untersucht und 
klassifiziert. 

anschlieGend werden die zulassigen hypothetischen Sprachkommandos nach vorgegebenen Kriterien auf ihre 
45 Plausibilitat untersucht und von den als plausibel erkannten hypothetischen Sprachkommandos dasjenige mit der 

hochsten Erkennungswahrscheinlichkeit ausgewahlt und als das vom Benutzer eingegebene Sprachkommando 
identifiziert. 

anschlieGend werden die dem identifizierten Sprachkommando zugeordneten Funktionen der zu steuernden Ge- 
rate initiiert und/oder Antworten gemaG einer vorgegebenen Sprachdialogstruktur zur Fortftihrung des Sprachdia- 
50 logs generiert. GemaG dieses Dokuments kann das beschriebene Verfahren auch zur Bedienung eines Zielfuh- 

rungssystems eingesetzt werden, wobei die Eingabe einer Zieladresse durch die Eingabe von Buchstaben oder 
von Buchstabengruppen in einem Buchstabiermodus erfolgt und wobei vom Benutzer eine Liste zur Speicherung 
von Zieladressen fur das Zielfuhrungssystem unter vorgebbaren Namen/Abkurzungen angelegt werden kann. 

55 [0008] Als nachteilig kann bei diesem beschriebenen Verfahren angesehen werden, daG auf die speziellen Eigen- 
schaften eines Zielfuhrungssystems nicht eingegangen wird und nur die Spracheingabe eines Zielortes mittels einem 
Buchstabiermodus angegeben wird. 

[0009] Aufgabe der Erfindung ist es, ein gattungsgemaGes Verfahren so weiterzubilden, daG die besonderen Eigen- 
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schaften eines Zielfuhrungssystems berucksichtigt werden und eine vereinfachte schnellere Spracheingabe einer Zie- 
ladresse in ein Zielfuhrungssystem moglich ist und dadurch der Bedienkomfort verbessert wird. Ferner soil eine ge- 
eignete Vorrichtung zur Durchfuhrung des Verfahrens angegeben werden. 

[001 0] Diese Aufgabe wird erf indungsgemaB mit den Merkmalen des Anspruches 1 Oder 1 2 geldst, wobei die Merk- 

5 male der Unteranspruche vorteilhafte Ausgestaltungen und Weiterbildungen kennzeichnen. 

[001 1 ] Das erfindungsgemaBe Verfahren zur Spracheingabe von Zieiadressen in ein Zielfuhrungssystem verwendet 
zur Spracherkennung eine aus dem Stand der Technik bekannte Spracherkennungseinrichtung wie sie beispielsweise 
in dem in der Beschreibungseinleitung gewurdigten Dokument beschrieben wird, wobei die Spracherkennungseinrich- 
tung wenigstens einen sprecherunabhangigen Spracherkenner und wenigstens einen sprecherabhangigen Zusatz- 

10 Spracherkenner umfaBt. Das erfindungsgemaBe Verfahren ermoglicht verschiedene Eingabedialoge zur Sprachein- 
gabe von Zieiadressen. In einem ersten Eingabedialog, im weiteren 'Zielorteingabe' genannt, wird der sprecherunab- 
hangige Spracherkenner zur Erkennung von isoliert gesprochenen Zielorten und, wenn der isoliert gesprochene Zielort 
nicht erkannt wurde, zur Erkennung von verbunden gesprochenen Buchstaben und/oder Buchstabengruppen benutzt. 
In einem zweiten Eingabedialog, im weiteren 'Zielort buchstabieren 1 genannt, wird der sprecherunabhangige Sprach- 

15 erkenner zur Erkennung von verbunden gesprochenen Buchstaben und/oder Buchstabengruppen benutzt. In einem 
dritten Eingabedialog, im weiteren 'Grobzieleingabe' genannt, wird der sprecherunabhangige Spracherkenner zur Er- 
kennung von isoliert gesprochenen Zielorten und, wenn der isoliert gesprochene Zielort nicht erkannt wurde, zur Er- 
kennung von verbunden gesprochenen Buchstaben und/oder Buchstabengruppen benutzt. In einem vierten Eingabe- 
dialog, im weiteren 'Indirekte Eingabe' genannt, wird der sprecherunabhangige Spracherkenner zur Erkennung von 

20 verbunden gesprochenen Ziffern und/oder Zifferngruppen benutzt. Bei einem funften Eingabedialog, im weiteren 'Stra- 
Beneingabe' genannt, wird der sprecherunabhangige Spracherkenner zur Erkennung von isoliert gesprochenen Stra- 
Bennamen und, wenn der isoliert gesprochene StraBenname nicht erkannt wird, zur Erkennung von verbunden ge- 
sprochenen Buchstaben und/oder Buchstabengruppen benutzt. Durch die bisher beschriebenen Eingabedialoge wer- 
den dem Zielfuhrungssystem verifizierte Zieiadressen, welche jeweils einen Zielort und eine StraBe umfassen, uber- 

25 geben. Bei einem sechsten Eingabedialog, im weiteren 'Adresse abrufen' genannt, wird zusatzlich zum sprecherun- 
abhangigen Spracherkenner der sprecherabhangige Zusatz-Spracherkenner zur Erkennung von isoliert gesprochenen 
Schlusselworten benutzt. Bei einem siebten Eingabedialog, im weiteren 'Adresse speichern* genannt, wird einem vom 
Benutzer isoliert gesprochenem Schlusselwort eine vom Benutzer eingegebene Zieladresse zugewiesen, wobei wah- 
rend des Eingabedialogs 'Adresse abrufen' ein dem entsprechenden erkannten Schlusselwort zugewiesene Zieladres- 

30 se an das Zielfuhrungssystem ubergeben wird. 

[0012] Das erfindungsgemaBe Verfahren beruht hauptsachlich darauf, daG nicht das gesamte zulassige Vokabular 
fur eine Spracherkennungseinrichtung zum Zeitpunkt ihrer Aktivierung in der Spracherkennungseinrichtung geladen 
ist, sondern daB in Abhangigkeit der notwendigen Eingabedialoge zur Ausfuhrung einer Bedienfunktion, zumindest 
ein notwendiges Lexikon aus dem gesamten moglichen Vokabular wahrend des Echtzeitbetriebs generiert und in die 

35 Spracherkennungseinrichtung geladen wird. In der Bundesrepublik Deutschland gibt es Ciber 100.000 Orte, die als 
Vokabular fur das Zielfuhrungssystem in Frage kommen. Wurde dieses Vokabular in die Spracherkennungseinrichtung 
geladen werden, so ware der Erkennungsvorgang extrem langsam und fehlerbehaftet. Ein aus diesem Vokabular ge- 
neriertes Lexikon umfaBt nur ca. 1500 Worte, dadurch wird der Erkennungsvorgang wesentlich schneller und die Er- 
kennungsrate wird groBer. Als Datengrundiage fur das erfindungsgemaBe Verfahren wird wenigstens eine Zieldatei, 

40 welche alle moglichen Zieiadressen und bestimmte Zusatzinformationen zu den moglichen Zieiadressen eines Ziel- 
fuhrungssystems umfaBt und auf mindestens einer Datenbasis gespeichert ist, verwendet. Aus dieser Zieldatei werden 
Lexika generiert, welche wenigstens Teile der Zieldatei umfassen, wobei wenigstens ein Lexikon in Abhangigkeit von 
wenigstens einem aktivierten Eingabedialog in Echtzeit generiert wird. Besonders vorteilhaft ist es wenn die Zieldatei 
zu jedem gespeicherten Zielort zusatzliche Informationen, beispielsweise Politische Zugehorigkeit bzw. Namenszu- 

45 satz, Postleitzahl bzw. Postleitzahlenbereich, Ortsnetzkennzahl, Bundesland, Einwohnerzahl, Geographische Codie- 
rung, Phonetische Beschreibung oder Lexikonzugehorigkeit enthalt. Diese Zusatzinformationen konnen dann zur Auf- 
losung von Mehrdeutigkeiten bzw. zur Beschleunigung der Auffindung des gewunschten Zielortes herangezogen wer- 
den. Anstelle der phonetischen Beschreibung kann fur die Spracherkennungseinrichtung eine Transkription der pho- 
netischen Beschreibung in Form von einer Kette von Indizes, je nach Realisierung der Transkription, verwendet werden. 

so Ferner kann eine sogenannte automatische phonetische Transkription, welche eine regelbasierende Umwandlung von 
orthographisch vorliegenden Namen unter Einbeziehung einer Ausnahmetabelle in eine phonetische Beschreibung 
durchfuhrt, vorgesehen werden. Die Eintragung der Lexikonzugehorigkeit ist nur dann moglich, wenn die entsprechen- 
den Lexika in einem 'Off-Line-Editiermodus\ auBerhalb des eigentlichen Betriebs des Zielfuhrungssystems, aus der 
Zieldatei generiert wurden und auf der mindestens einen Datenbasis, beispielsweise einer CD-ROM oder einer exter- 

55 nen Datenbank in einer Zentrale, auf die uber entsprechende Kommunikationseinrichtungen, beispielsweise Mobilfun- 
knetz, zugegriffen werden kann, gespeichert wurden. Die Generierung der Lexika im 'Off-Line-Editiermodus' ist nur 
sinnvoll, wenn genugend Speicherplatz auf der mindestens einen Datenbasis vorhanden ist, und bietet sich besonders 
fur Lexika an, welche besonders haufig benotigt werden. Als Datenbasis fur die Zieldatei bietet sich besonders eine 
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CD-Rom oder eine externe Datenbank an, da dadurch die Zieldatei immer auf dem aktuellsten Stand gehalten werden 
kann. Im Augenblick sind noch nicht alle moglichen Ortsnamen der Bundesrepublik Deutschland digitalisiert und auf 
einer Datenbasis abgelegt. Desgleichen ist nicht fur alle Orte eine entsprechende StraGenliste vorhanden. Deshalb ist 
es wichtig, die Datengrundlage jederzeit aktualisieren zu konnen. Als Datenbasis fur das mindestens eine im 'Off-Line- 
5 Editiermodus' generierte Lexikon kann auch ein interner nicht fluchtiger Speicherbereich des Zielfuhrungssystems 
benutzt werden. 

[001 3] Urn die Spracheingabe einer gewunschten Zieladresse an das Zielf uhrungssystem schneller durchfuhren zu 
konnen, wird nach der Initialisierungsphase des Zielfuhrungssystems bzw. bei einem genugend groGen nicht fluchtigen 
internen Speicherbereich nach jedem Wechsel der Datenbasis, ein Grundvokabular geladen, welches wenigstens ein 

10 aus der Zieldatei generiertes Grund-Lexikon umfaGt. Die Generierung dieses Grund-Lexikons kann bereits im 'Off- 
Line-Editiermodus' erfolgt sein. Das Grund-Lexikon kann zusatzlich zu der Zieldatei auf der Datenbasis gespeichert 
sein Oder im nicht fluchtigen internen Speicherbereich des Zielfuhrungssystems abgelegt sein. Als Alternative kann 
die Generierung des Grund-Lexikons erst nach der Initialisierungsphase erfolgen. Das dynamische Generieren von 
Lexika wahrend des Echtzeitbetriebs des Zielfuhrungssystems, d.h. wahrend der Laufzeit, bringt zwei wesentliche 

15 Vorteile mit sich. Zum einen besteht dadurch die Moglichkeit beliebige Lexika aus der auf der mindestens einen Da- 
tenbasis abgelegten Datengrundlage zusammenzustellen und zum zweiten spart man erheblichen Speicherplatz auf 
der mindestens einen Datenbasis, da nicht alle fur die verschiedenen Eingabedialoge benotigten Lexika auf der min- 
destens einen Datenbasis vor der Aktivierung des Spracherkenners abgelegt sein mussen. 

[0014] Bei der nachfolgend beschriebenen Ausfuhrungsform umfaGt das Grundvokabular zwei im 'Off-Line-Editier- 
20 modus' generierte und auf der mindestens einen Datenbasis gespeicherte Lexika und zwei Lexika, welche nach der 
Initialisierungsphase generiert werden. Besitzt die Spracherkennungseinrichtung genugend Arbeitsspeicher, so wird 
das Grundvokabular nach der Initialisierungsphase zusatzlich zu den zulassigen Sprachkommandos fur das Sprach- 
dialogsystem gemaG der WO-A-97 10 583 in die Spracherkennungseinrichtung geladen. Das Sprachdialogsystem 
erlaubt dann nach der Initialisierungsphase und dem Betatigen der PTT-Taste die Eingabe von verschiedenen Infor- 
ms mationen mit der Absicht die an das Sprachdialogsystem angeschlossenen Gerate zu steuern sowie die Grundfunk- 
tionen eines Zielfuhrungssystems zu bedienen und einen Zielort und/oder eine StraGe als Zieladresse fur das Zielfuh- 
rungssystem einzugeben. Besitzt die Spracherkennungseinrichtung zu wenig Arbeitsspeicher so wird das Grundvo- 
kabular erst in die Spracherkennungseinrichtung geladen, wenn eine entsprechende Bedienfunktion, welche auf das 
Grundvokabular zuruckgreift, aktiviert wurde. Das auf der mindestens einen Datenbasis gespeichertes Grund-Lexikon 
30 umfaGt die 'p' groGten Stadte der Bundesrepublik Deutschland, wobei der Parameter 'p' bei der beschriebenen Aus- 
fuhrung auf 1000 gesetzt ist. Damit werden ca. 53 Mio. Bundesburger oder 65% der Bevolkerung direkt erfaGt. Das 
Grund-Lexikon umfaGt alle Orte mit mehr als 15.000 Einwohnern. Ein ebenfalls auf der Datenbasis gespeichertes 
Region-Lexikon umfaBt 'z' Namen von Regionen und Gebieten wie z.B. Bodensee, Schwabische Alb usw M wobei bei 
der beschriebenen Ausfuhrung das Region-Lexikon ca. 100 Namen umfaGt. Das Region-Lexikon dient zur Erfassung 
35 von bekannten Gebieten und gebrauchlichen Regionsnamen. Hinter diesen Namen verstecken sich Zusammenfas- 
sungen von Ortsnamen, die nach dem Einsprechen des Gebiets- oder Regionsnamens als neues Gebiets-Lexikon 
generiert und geladen werden konnen. Ein Umgebungs-Lexikon, welches erst nach der Initialisierung generiert wird, 
umfaGt 'a' dynamisch nachgeladene Ortsnamen rund urn den aktuellen Fahrzeugstandort, dadurch konnen auch klei- 
nere Orte in der unmittelbaren Umgebung direkt angesprochen werden, wobei der Parameter 'a' bei der beschriebenen 
40 Ausfuhrungsform auf 400 gesetzt ist. Dieses Umgebungs-Lexikon wird auch wahrend der Fahrt in bestimmten Abstan- 
den immer wieder aktualisiert, damit es immer moglich ist, Orte in der unmittelbaren Umgebung direkt einzusprechen. 
Der aktuelle Fahrzeugstandort wird dem Zielfuhrungssystem von einem aus dem Stand der Technik bekannten Or- 
tungsverfahren, beispielsweise mittels einem Global Positioning System (GPS), mitgeteilt. Die bisher beschriebenen 
Lexika sind dem sprecherunabhangigen Spacherkenner zugeordnet. Ein Namen-Lexikon, welches nicht aus der Ziel- 
45 datei generiert wird und dem sprecherabhangigen Spracherkenner zugeordnet ist, umfaGt ca. 1 50 vom Benutzer ge- 
sprochene Schlusselworte aus dem personlichen AdreGregister des Benutzers. Jedem Schlusselwort wird dabei mittels 
dem Eingabedialog 'Adresse speichern' eine bestimmte Zieladresse aus der Zieldatei zugeordnet. Diese bestimmte 
Zieladresse wird durch die Spracheingabe des zugeordneten Schlusseiworts mittels dem Eingabedialog 'Adresse ab- 
rufen' an das Zielfuhrungssystem ubergeben. Damit ergibt sich ein Grundvokabular von ca. 1650 Wortern, die der 
so Spracherkennungseinrichtung bekannt sind und als isoliert gesprochenes Wort (Ortsnamen, StraGennamen, Schlus- 
selwort) eingegeben werden konnen. 

[0015] Zusatzlich kann vorgesehen werden, Adressen aus einer externen Datenquelle, beispielsweise einem per- 
sonlichen elektronischen Datensystem oder einem tragbaren Kleinrechner (Laptop), mittels einer Datenubertragung 
an das Sprachdialogsystem bzw. an das Zielfuhrungssystem zu ubertragen und als Adressen-Lexikon in das Grund- 
55 vokabular zu integrieren. Normaierweise sind auf den externen Datenquellen keine phonetischen Beschreibungen fur 
die AdreGdaten (Namen, Zielort, StraGe) abgelegt. Urn diese Daten trotzdem in das Vokabular fur eine Spracherken- 
nungseinrichtung ubernehmen zu konnen, muG eine automatische phonetische Transkription dieser AdreGdaten, ins- 
besondere der Namen durchgefuhrt werden. Uber eine Tabelle wird anschlieGend eine Zuweisung zum richtigen Zielort 
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realisiert. 

[0016] Fur die im folgenden beschriebenen Dialogbeispiele muB auf der mindestens einen Datenbasis des Zielfuh- 
rungssystems eine Zieldatei abgelegt werden, welche fur jeden im Zielfuhrungssystem erfaBten Ort einen Datensatz 
gemaB Tabelle 1 enthalt. Je nach Speicherplatz und Verfugbarkeit konnen von den angegebenen Informationen auch 
Teile fehlen. Dies betrifft aber nur Daten, die zur Auflosung von Mehrdeutigkeiten herangezogen werden wie z.B. 
Namenszusatz, Kreiszugehorigkeit, Vorwahlnummern usw.. Werden AdreBdaten von einer externen Datenquelle ver- 
wendet, so mussen die AdreBdaten entsprechend erganzt werden. Von besonderer Bedeutung sind die Wortunterein- 
heiten fur die Spracherkennungseinrichtung, welche als Hidden-Markov- Model-Spracherkenner arbeitet (HMM-Erken- 
ner) 

Tabelle 1 



Beschreibung des Eintrags 


Beispiel 


Ortsnamen 


Flensburg 


Politische Zugehdrigkeit bzw. Namenszusatz 




Postleitzahl bzw. Postleitzahlenbereich 


24900 - 24999 


Vorwahlnummer 


0461 


Stadt- bzw. Landkreiszugehorigkeit 


Flensburg, Stadtkreis 


Bundesland 


Schleswig-Holstein 


Einwohnerzahl 


87526 


Geographische Codierung 


9.43677, 54.78204 


Phonetische Beschreibung 


|fl'Ens|bUrk| 


Wortuntereinheiten fur den HMM-Spracherkenner 


f[LN]le E[LN] n[C] s b[Vb] U[Vb]r k. bzw. 101 79 124 117 12 
39 35 82 68 


Lexikonzugehorigkeit 


3, 4, 78 ... 



15 



20 



25 



30 



35 



40 



45 



50 



55 



[0017] Die Erfindung ist im Folgenden anhand von Ausfuhrungsbeispielen in Verbindung mit den Zeichnungen naher 
erlautert. Es zeigen: 

Fig. 1: in schematischer Darstellung eine Obersicht uber die moglichen Eingabedialoge zur Spracheingabe einer 
Zieladresse fur ein Zielfuhrungssystem; 

Fig. 2: in schematischer Darstellung ein Ablaufdiagramm eines ersten Ausfuhrungsbeispiels fur den Eingabedialog 
'Zielorteingabe'; 

Fig. 3: in schematischer Darstellung ein Ablaufdiagramm eines zweiten Ausfuhrungsbeispiels fur den Eingabedia- 
log 'Zielorteingabe'; 

Fig. 4: in schematischer Darstellung ein Ablaufdiagramm fur den Eingabedialog 'Aus Liste auswahlen'; 

Fig. 5: in schematischer Darstellung ein Ablaufdiagramm fur den Eingabedialog 'Mehrdeutigkeit auflosen'; 

Fig. 6: in schematischer Darstellung ein Ablaufdiagramm fur den Eingabedialog 'Zielort buchstabieren'; 

Fig. 7: in schematischer Darstellung ein Ablaufdiagramm fur den Eingabedialog 'Grobzieleingabe'; 

Fig. 8: in schematischer Darstellung ein Ablaufdiagramm fur den Eingabedialog 'Adresse speichenY; 

Fig. 9: in schematischer Darstellung ein Ablaufdiagramm fur den Eingabedialog 'StraBeneingabe'; 

Fig. 1 0: in schematischer Darstellung ein Blockschaltbild einer Vorrichtung zur Durchfuhrung des erfindungsge- 
maBen Verfahrens. 
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[0018] Fig. 1 zeigt eine Ubersicht uber die moglichen Eingabedialoge zur Spracheingabe einer Zieladresse fur ein 
Zielfuhrungssystem. Ein Sprachdialog zwischen einem Benutzer und einem Sprachdialogsystem gemaB Fig. 1 beginnt 
nach der Initialisierungsphase mit einem Wartezustand 0, indem das Sprachdialogsystem verbleibt, bis die PTT-Taste 
(Push-to-Talk-Taste) betatigt wird und in den das Sprachdialogsystem nach Beendigung des Sprachdialogs zuriick- 
kehrt. Der Benutzer aktiviert das Sprachdialogsystem durch Betatigen der PTT-Taste im Schritt 100. Das Sprachdia- 
logsystem antwortet im Schritt 200 mit einer akustischen Ausgabe, beispielsweise durch einen Signalton oder durch 
eine Sprachausgabe, welche dem Benutzer anzeigt, daB das Sprachdialogsystem bereit ist ein Sprachkommando 
entgegenzunehmen. Im Schritt 300 wartet das Sprachdialogsystem nun auf ein zulassiges Sprachkommando, urn 
mittels einer Dialog- und Ablaufsteuerung die verschiedenen mit dem Sprachdialogsystem verbundenen Gerate zu 
steuern oder einen entsprechenden Eingabedialog zu starten. Im Einzelnen wird hier aber nur auf die zulassigen 
Sprachkommandos naher eingegangen, welche das Zielfuhrungssystem betreffen. Es konnen an dieser Stelle folgen- 
de, die verschiedenen Eingabedialoge des Zielfuhrungssystem betreffenden Sprachkommandos eingegeben werden: 

- "Zielorteingabe" E1 : Durch dieses Sprachkommando wird der Eingabedialog 'Zielorteingabe' aktiviert. 

- "Zielort buchstabieren" E2: Durch dieses Sprachkommando wird der Eingabedialog 'Zielort buchstabieren 1 akti- 
viert. 

- "Grobzieleingabe" E3: Durch dieses Sprachkommando wird der Eingabedialog 'Grobzieleingabe' aktiviert. 

- "Postleitzahl" E4 oder "Ortsnetzkennzahr E5: Durch diese beiden Sprachkommandos wird der Eingabedialog 
'Indirekte Eingabe' aktiviert. 

- "StraBeneingabe" E6: Durch dieses Sprachkommando wird der Eingabedialog 'StraBeneingabe' aktiviert. 

- "Adresse speichern" E7: Durch dieses Sprachkommando wird der Eingabedialog 'Adresse speichern' aktiviert. 

- "Adresse abrufen" E8: Durch dieses Sprachkommando wird der Eingabedialog 'Adresse abrufen' aktiviert. 

[0019] Anstelle der ober angegebenen konnen naturlich auch andere Begriffe zur Aktivierung der verschiedenen 
Eingabedialoge verwendet werden. Zusatzlich zu den ober angegebenen Sprachkommandos konnen auch allgemeine 
Sprachkommandos zur Steuerung des Zielfuhrungssystems, beispielsweise "Zielfuhrungsinformation", "Zielfuhrung 
start/stop" usw., eingegeben werden. 

[0020] Nach dem Starten eines Eingabedialogs durch das Sprechen des entsprechenden Sprachkommandos wer- 
den die entsprechenden Lexika als Vokabular in die Spracherkennungseinrichtung geladen. Bei einer erfolgreich durch- 
gefuhrten Spracheingabe des Zielortes als Teil der Zieladresseneingabe mittels einem der Eingabedialoge 'Zielortein- 
gabe' im Schritt 1 000, 'Zielort buchstabieren' im Schritt 2000, 'Grobzieleingabe' im Schritt 3000 Oder 'Indirekte Eingabe' 
im Schritt 4000 wird anschlieBend im Schritt 350 uberpruft, ob fiir den erkannten Zielort eine entsprechende StraBen- 
liste vorhanden ist Oder nicht. Ergibt die Uberprufung ein negatives Ergebnis, dann wird zum Schritt 450 verzweigt. 
Gelangt die Oberprufung zu einem positiven Ergebnis, so wird im Schritt 400 abgefragt, ob der Benutzer einen Stra- 
Bennamen eingeben will oder nicht. Beantwortet der Benutzer die Abfrage 400 mit "Ja", so wird der Eingabedialog 
'StraBeneingabe' aufgerufen. Beantwortet der Benutzer die Abfrage 400 mit "Nein" so wird zum Schritt 450 verzweigt. 
Die Abfrage 400 wird also nur dann durchgefuhrt, wenn fiir den entsprechenden Zielort auch die StraBennamen im 
Zielfuhrungssystem erfaBt sind. Im Schritt 450 wird der erkannte gewunschte Zielort automatisch durch die Angabe 
Zentrum, oder Stadtmitte als StraBeneingabe erganzt, da an das Zielfuhrungssystem nur eine vollstandige Zieladresse 
ubergeben werden kann, wobei die Zieladresse neben dem Zielort auch eine StraBe oder ein Sonderziel, beispiels- 
weise Bahnhof, Flughafen, Stadtmitte usw., umfaBt. Im Schritt 500 wird die Zieladresse an das Zielfuhrungssystem 
ubergeben. AnschlieBend wird der Sprachdialog beendet und das Sprachdialogsystem kehrt in den Wartezustand 0 
zuriick. Wurde zu Beginn des Sprachdialogs im Schritt 300 das Sprachkommando "StraBeneingabe" E6 vom Benutzer 
gesprochen und von der Spracherkennungseinrichtung erkannt, dann wird im Schritt 5000 der Eingabedialog 'Stra- 
Beneingabe' aktiviert. AnschlieBend wird nach der erfolgreichen Eingabe des gewunschten Zielortes und der StraBe, 
die Zieladresse im Schritt 500 an das Zielfuhrungssystem ubergeben. Wurde zu Beginn des Sprachdialogs im Schritt 
300 das Sprachkommando "Adresse abrufen" E8 vom Benutzer gesprochen und von der Spracherkennungseinrich- 
tung erkannt, dann wird im Schritt 6000 der Eingabedialog 'Adresse abrufen' aktiviert. Im Eingabedialog 'Adresse 
abrufen' wird ein Schlusselwort durch den Benutzer gesprochen und die dem gesprochenen Schlusselwort zugeord- 
nete Adresse wird im Schritt 500 als Zieladresse dem Zielfuhrungssystem ubergeben. Wurde zu Beginn des Sprach- 
dialogs im Schritt 300 das Sprachkommando "Adresse speichern" E7 vom Benutzer gesprochen und von der Sprach- 
erkennungseinrichtung erkannt, dann wird im Schritt 7000 der Eingabedialog 'Adresse speichern' aktiviert. Mittels dem 
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Eingabedialog 'Adresse speichern' wird eine eingegebene Zieladresse unter einem vom Benutzer gesprochenen 
Schlusselwort im personlichen AdreBregister abgelegt. AnschlieBend wird der Eingabedialog 'Adresse abrufen' been- 
det und das System kehrt in den Wartezustand 0 zuruck. 

[0021 ] Die Fig. 2 zeigt in schematischer Darstellung eine erste Ausfuhrungsform des Eingabedialogs 'Zielorteingabe'. 

5 Nach der Aktivierung des Eingabedialogs 'Zielorteingabe' im Schritt 1000 durch das im Schritt 300 vom Benutzer 
gesprochene und von der Spracherkennungseinrichtung erkannte Sprachkommando "Zielorteingabe" E1 wird, wie aus 
der Fig. 2 ersichtlich ist, im Schritt 1010 das Grundvokabular in die Spracherkennungseinrichtung geladen. Das Laden 
des Grundvokabulars in die Spracherkennungseinrichtung kann grundsatzlich auch an einer anderen Stelle, beispiels- 
weise nach der Initialisierungsphase oder nach der Betatigung der PTT-Taste, erfolgen. Dies ist von der Geschwin- 

10 digkeit des Ladevorgangs abhangig und von der Art der verwendeten Spracherkennungseinrichtung. AnschlieBend 
wird im Schritt 1020 der Benutzer aufgefordert einen Zielort einzugeben. Der Benutzer gibt im Schritt 1030 mittels 
Spracheingabe den gewunschten Zielort ein. Diese Spracheingabe wird im Schritt 1040 als akustischer Wert 
<Zielort_1 > an die Spracherkennungseinrichtung ubergeben und dort mit dem geladenen Grundvokabular verglichen, 
wobei als akustischer Wert Abtastwerte im Zeit- Oder Frequenzbereich oder Merkmalsvektoren an die Spracherken- 

15 nungseinrichtung ubergeben werden konnen. Die Art des ubergebenen akustischen Wert ist ebenfalls von der Art des 
verwendeten Spracherkenners abhangig. Als Ergebnis liefert der Spracherkenner eine erste Hypothesenliste hypo.1 
mit Ortsnamen, welche nach Erkennungwahrscheinlichkeit sortiert sind. Enthalt die Hypothesenliste hypo.1 homopho- 
ne Ortsnamen, d. h. Ortsnamen, welche identisch ausgesprochen, aber unterschiedlich geschrieben werden, beispiels- 
weise Ahlen und Aalen, so erhalten beide Ortsnamen die gleiche Erkennungswahrscheinlichkeit und beide Ortsnamen 

20 werden bei der Fortsetzung des Eingabedialogs berucksichtigt. AnschlieBend wird im Schritt 1050 der Ortsname mit 
der groBten Erkennungswahrscheinlichkeit als Sprachausgabe <hypo.1 .1> an den Benutzer mit der Frage ausgege- 
ben, ob <hypo.1.1> dem gewunschten eingegebenen Zielort <Zielort_1> entspricht Oder nicht. Hier ist es noch uner- 
heblich, ob an der ersten Stelle der Hypothesenliste mehrere Eintrage stehen oder nicht, da die Ortsnamen identisch 
gesprochen werden. Wird die Abfrage 1050 mit \Ja° beantwortet, so wird zum Schritt 1150 gesprungen. Beantwortet 

25 der Benutzer die Frage mit "Nein" so wird der akustische Wert <Zielort_1 > des eingegebenen Zielortes im Schritt 1 060 
fur einen eventuellen spateren Erkennungsvorgang mit einem anderen Lexikon gespeichert. AnschlieBend wird der 
Benutzer im Schritt 1070 aufgefordert den Zielort nochmals zu sprechen. Der Benutzer gibt im Schritt 1080 mittels 
Spracheingabe den Zielort nochmals ein. Diese Spracheingabe wird im Schritt 1090 als akustischer Wert <Zielort_2> 
an die Spracherkennungseinrichtung ubergeben und dort mit dem geladenen Grundvokabular verglichen. Als Ergebnis 

30 liefert die Spracherkennungseinrichtung eine zweite Hypothesenliste hypo.2 mit Ortsnamen, welche nach Erkennung- 
wahrscheinlichkeit sortiert sind. Im Schritt 1100 wird uberpruft, ob der ASCII-Wert des Ortsnamens, bzw. bei homo- 
phonen Ortsnamen die ASCII-Werte der Ortsnamen, mit der groBten Erkennungswahrscheinlichkeit hypo.1 .1 der Hy- 
pothesenliste hypo.1 mit dem ASCII-Wert des Ortsnamen, bzw. bei homophonen Ortsnamen die ASCII-Werte der 
Ortsnamen, mit der groBten Erkennungswahrscheinlichkeit hypo.2.1 ubereinstimmt bzw ubereinstimmen. Ist dies der 

35 Fall, so wird im Schritt 1110 der Ortsnamen mit der zweitgrdBten Erkennungswahrscheinlichkeit aus der zweiten Hy- 
pothesenliste hypo.2 als Sprachausgabe <hypo.2.2> mit der Frage an den Benutzer ausgegeben, ob <hypo.2.2> der 
gewunschte Zielort ist Oder nicht. Gelangt die Oberprufung 1 1 00 zu einem negativen Ergebnis, so wird im Schritt 1 1 20 
der Ortsname mit der groBten Erkennungswahrscheinlichkeit aus der zweiten Hypothesenliste hypo.2 als Sprachaus- 
gabe <hypo.2.1> an den Benutzer mit der Frage ausgegeben, ob <hypo.2.1> der gewunschte Zielort ist oder nicht. 

40 Ergibt die Antwort des Benutzers, daB der gewunschte Zielort immer noch nicht erkannt wurde, so wird im Schritt 1 1 40 
der Eingabedialog 'Zielort buchstabieren' aufgerufen. Ergibt die Antwort des Benutzers, daB ein Zielort erkannt wurde, 
so wird im Schritt 1150, zum Schritt 1150 gelangt man auch, wenn die Abfrage 1050 mit "Ja" beantwortet wurde, der 
ASCII-Wert des erkannten Zielorts, bzw. bei homophonen Ortsnamen die ASCII-Werte der erkannten Ortsnamen, 
(entweder hypo.1 . 1 , hypo.2.1 oder hypo.2.2) mit den ASCII-Werten der in den Datensatzen der Zieldatei gespeicherten 

45 Ortsnamen verglichen. Aus alien Ortsnamen in denen einer der erkannten Zielorte in der Orthographie ganz enthalten 
ist wird dann eine Mehrdeutigkeitsliste erzeugt. Bei homophonen Ortsnamen enthalt die Mehrdeutigkeitsliste immer 
mehrere Eintrage, und das Ergebnis ist deshalb nicht eindeutig. 

[0022] Es kann an dieser Stelle aber auch bei nicht homophonen Ortsnamen zu einer Mehrdeutigkeitsliste mit meh- 
reren Eintragen, dem sogenannten "Neustadt-Problem", kommen, wenn die orthographische Schreibweise des ein- 

50 gegebenen Zielorts mehrfach in der Zieldatei vorhanden ist. Deshalb wird im Schritt 1160 uberpruft, ob der Zielort 
eindeutig erkannt wurde oder nicht. Ist der Zielort nicht eindeutig, so wird zum Schritt 1170 verzweigt. Dort wird ein 
achter Eingabedialog, im weiteren 'Mehrdeutigkeit auflosen' genannt, aufgerufen. Ist der Zielort eindeutig, so wird 
durch die Sprachausgabe im Schritt 1180 der gefundene Zielort mit bestimmten Zusatzinformationen, beispielsweise 
Postleitzahl, Ortsname und Bundesland, mit der Frage an den Benutzer ausgegeben, ob es sich urn den gewunschten 

55 Zielort handelt Oder nicht. Beantwortet der Benutzer die Frage mit "Nein", so wird zum Schritt 1140, welcher den Ein- 
gabedialog 'Zielort buchstabieren' aufruft, verzweigt. Beantwortet der Benutzer die Frage mit "Ja" so wird im Schritt 
1190 der Zielort zwischen gespeichert und zum Schritt 350 (siehe Beschreibung zu Fig. 1) gesprungen. 
[0023] Die Fig. 3 zeigt in schematischer Darstellung eine zweite Ausfuhrungsform des Eingabedialogs 'Zielortein- 
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gabe'. Die Verfahrensschritte 1 000 bis 1 060 wurden bereits in der Beschreibung zur Fig. 2 abgehandelt. Im Unterschied 
zur ersten Ausfuhrungsform des Eingabedialogs wird nach dem Schritt 1060 der Eingabedialog 'Zielorteingabe' mit 
dem Schritt 1075 und nicht mit dem Schritt 1070 fortgesetzt. Im Schritt 1075 wird der Ortsnamen mit der zweitgrdGten 
Erkennungswahrscheinlichkeit der ersten Hypothesenliste hypo.1 als Sprachausgabe <hypo.1.2> mit der Frage an 
den Benutzer ausgegeben, ob <hypo.1 .2> dem gewunschten eingegebenen Zielort <Zielort_1 > entspricht oder nicht. 
Wird die Abfrage 1 075 mit "Ja" beantwortet, so wird zum Schritt 1 1 50 gesprungen. Beantwortet der Benutzer die Frage 
mit "Nein" so wird zum Schritt 1 1 40 verzweigt. Im Schritt 1 1 40 wird der Eingabedialog 'Zielort buchstabieren 1 aufgerufen. 
Die Verfahrensschritte ab Schritt 1 1 50 wurden bereits in der Beschreibung zur Fig. 2 abgehandelt und werden deshalb 
hier nicht mehr beschrieben. 

[0024] Fig. 4 zeigt in schematischer Darstellung eine Ausfuhrungsform eines Ablaufdiagramms fur einen achten 
Eingabedialog, im weiteren 'Aus Liste auswahlen' genannt, zur Auswahl eines Eintrags aus einer Liste. Nach der 
Aktivierung des Eingabedialogs 'Aus Liste auswahlen' im Schritt 1430 durch einen anderen Eingabedialog wird der 
Benutzer im Schritt 1440 uber die Anzahl der Eintrage in der Liste informiert und im Schritt 1445 gefragt, ob die Liste 
vorgelesen werden soil oder nicht. Beantwortet der Benutzer die Frage mit "Ja" so wird im Schritt 1450 ein Vorleseflag 
gesetzt und anschlieGend zum Schritt 1460 verzweigt. Beantwortet der Benutzer die Frage mit "Nein", so wird der 
Ablauf direkt mit dem Schritt 1460 fortgefuhrt. Im Schritt 1460 wird dem Benutzer die Liste mit der Aufforderung an- 
gezeigt, einen Eintrag von der Liste auszuwahlen, wobei die Anzeige der Liste bei nicht gesetztem Vorleseflag nur auf 
einer Anzeigeeinrichtung des Zielfuhrungssystems erfoigt. 1st das Vorleseflag gesetzt wird die Liste zusatzlich mittels 
Sprachausgabe vorgelesen. Die Liste wird dabei in Seiten aufgeteilt, die beispielsweise bis zu vier Eintrage umfassen, 
wobei die Eintrage auf jeder Seite wieder fortlaufend beginnend mit eins durchnumerieret werden. Im Schritt 1460 
kann der Benutzer verschiedene Sprachkommandos zur Weiterfuhrung des Eingabedialogs sprechen. Mit einem er- 
sten Sprachkommando E9, beispielsweise "weiter", kann der Benutzer im Schritt 1470 zur nachsten Seite der Liste 
umblattern und anschlieGend zum Schritt 1460 zuruckkehren. Mit einem zweiten Sprachkommando E10, beispiels- 
weise "zuriick", kann der Benutzer im Schritt 1475 zur vorherigen Seite der Liste zuruckblattern und ebenfalls zum 
Schritt 1460 zuruckkehren. Mit einem dritten Sprachkommando E11 , beispielsweise "Nummer X", kann der Benutzer 
einen bestimmten Eintrag aus der Liste auswahlen, wobei X fur die Nummer des gewunschten Eintrags steht. Nach 
dem Sprechen des dritten Sprachkommandos E11 wird zum Schritt 1480 verzweigt. Mit einem vierten Sprachkom- 
mando E12, beispielsweise "Abbruch" kann der Benutzer, wenn er beispielsweise den gewunschten Eintrag nicht 
gefunden hat, den Eingabedialog 'Aus Liste auswahlen' beenden. Deshalb wird nach Eingabe des vierten Sprachkom- 
mandos zum Schritt 1500 verzweigt. Im Schritt 1500 wird abhangig davon, ob die Eintrage in der Liste aus StraGen- 
namen oder Ortsnamen bestehen, der Benutzer durch eine Sprachausgabe daruber informiert, daG der StraGenname 
bzw. der Ortsname nicht gefunden werden konnte. AnschlieGend kehrt das System in den Wartezustand 0 zuriick. Im 
Schritt 1480 wird durch eine Abfrage an den Benutzer nochmals uberpruft, ob der <Eintrag_X> richtig ist Oder nicht. 
Urn die Auswahl des gewunschten Eintrages aus der Liste komfortabler zu gestalten, kann auch vorgesehen werden, 
daG die entsprechende Liste als Listen-Lexikon generiert und in die Spracherkennungseinrichtung geladen wird. Da- 
durch kann der Benutzer die Auswahl des Eintrags wie oben beschrieben durch die Sprechen der entsprechenden 
Nummer als drittes Sprachkommando E11 durchfuhren oder er kann den entsprechenden Eintrag von der Liste ablesen 
und als drittes Sprachkommando E11 eingeben. In der Liste steht beispielsweise der gewiinschte Eintrag: 4. Neustadt 
an der WeinstraGe, so kann der Benutzer entweder "Nummer 4" oder "Neustadt an der WeinstraGe" als drittes Sprach- 
kommando E11 sprechen und das System erkennt in beiden Fallen den gewunschten Eintrag. Beantwortet der Benut- 
zer die Abfrage 1480 mit "Ja" so wird im Schritt 1490 der Eingabedialog 'Aus Liste auswahlen' beendet und der aus- 
gewahlte 'Eintrag_X' als Ergebnis an den aufrufenden Eingabedialog ubergeben. Beantwortet der Benutzer die Abfrage 
1480 mit "Nein", so wird zum Schritt 1500 verzweigt. 

[0025] Fig. 5 zeigt in schematischer Darstellung eine Ausfuhrungsform eines Ablaufdiagramms fur einen neunten 
Eingabedialog, im weiteren 'Mehrdeutigkeit auflosen' genannt, zur Auflosung von Mehrdeutigkeiten, beispielsweise 
fur das sogenannte "Neustadt-Problem" oder fur homophone Ortsnamen. Nach dem Aktivieren des Eingabedialogs 
'Mehrdeutigkeit auflosen' im Schritt 1 1 70 durch einen anderen Eingabedialog wird der Benutzer im Schritt 1 200 daruber 
informiert, wieviele Ortsnamen in der Mehrdeutigkeitsliste eingetragen sind. AnschlieGend wird im Schritt 1 21 0 der Ort 
mit der groGten Einwohnerzahl gesucht und im Schritt 1220 als akustischer Wert <gr6Gter_Ort> mit der Abfrage aus- 
gegeben, ob der Benutzer <gr6Gter_Ort> als Zielort wunscht oder nicht. Beantwortet der Benutzer die Abfrage 1220 
mit "Ja" so wird zum Schritt 1410 gesprungen. Im Schritt 1410 wird 'gr6Gter_Ort' als Ergebnis an den aufrufenden 
Eingabedialog ubergeben und der Eingabedialog 'Mehrdeutigkeit auflosen' beendet. Beantwortet der Benutzer die 
Abfrage 1220 mit "Nein", so wird im Schritt 1230 uberpruft, ob die Mehrdeutigkeitsliste mehr als k Eintrage umfaGt 
Oder nicht. UmfaGt die Mehrdeutigkeitsliste k oder weniger Eintrage so wird im Schritt 1240 der Eingabedialog 'Aus 
Liste auswahlen' aufgerufen. Der Parameter k sollte nicht zu groG gewahlt werden, da sonst der Eingabedialog 'Aus 
Liste auswahlen' zu lange dauert. Als gunstiger Wert hat sich bei der Erprobung k = 5 erwiesen. Ergibt die Uberprufung 
1230 ein positives Ergebnis, so wird im Schritt 1250 mit einem ersten Abfragedialog versucht, die Anzahl der Eintrage 
in die Mehrdeutigkeitsliste zu verkleinern. Nach dem ersten Abfragedialog wird im Schritt 1 260 uberpruft, ob der Zielort 
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eindeutig ist oder nicht. Kommt die Uberprufung 1260 zu einem positiven Ergebnis, dann wird zum Schritt 1410 ver- 
zweigt, kommt die Uberprufung 1260 zu einem negativen Ergebnis so wird analog zum Schritt 1230 im Schritt 1270 
uberpruft ob die Mehrdeutigkeitsliste mehr als k Eintrage umfaBt Oder nicht. UmfaBt die Mehrdeutigkeitsiiste k oder 
weniger Eintrage so wird zum Schritt 1240 verzweigt, umfaBt die Mehrdeutigkeitsliste mehr als k Eintrage, so wird mit 

s einem zweiten Abfragedialog im Schritt 1280 versucht die Anzahl der Eintrage in der Mehrdeutigkeitsliste zu verklei- 
nern. Die beschriebenen Vorgange wiederholen sich bis zu einem n-ten Abfragedialog im Schritt 1290. Nach dem n- 
ten Abfragedialog wird im Schritt 1300 analog zum Schritt 1260 uberpruft ob der Zielort eindeutig ist oder nicht. Ist der 
Zielort eindeutig, so wird zum Schritt 1 41 0 verzweigt, wenn nicht, dann wird zum Schritt 1 240 verzweigt. Der im Schritt 
1240 aufgerufene Eingabedialog 'Aus Liste auswahlen' liefert als Ergebnis einen eindeutigen Zielort an den Einabe- 

10 dialog 'Mehrdeutigkeit auflosen' zuruck. Im Schritt 1 41 0 wird als Ergebnis des Eingabedialogs 'Mehrdeutigkeit auflosen' 
ein eindeutiger Zielort an den aufrufenden Eingabedialog weitergegeben und der Eingabedialog 'Mehrdeutigkeit auf- 
losen 1 beendet. Als Abfragedialoge konnen beispielsweise die Abfragen nach der Postleitzahl, der Ortsnetzkennzahl, 
dem Bundesland Oder der nachstgroBten Stadt verwendet werden. Die Abfragedialoge beginnen mit einer Uberpru- 
fung, ob die entsprechende Abfrage sinnvoll ist oder nicht. Befinden sich beispielsweise alle Ortsnamen auf der Mehr- 

15 deutigkeitsliste in einem Bundesland, so ist die Abfrage nach dem Bundesland sinnlos und der Bundesland-Abfrag- 
dialog wird beendet. Zur Bewertung ob eine Abfrage sinnvoll ist Oder nicht konnen verschiedene Kriterien herangezo- 
gen werden. So kann beispielsweise ein absoluter Schwellwert, beispielsweise 8 Eintrage besitzen das Abfragekrite- 
rium oder 80% der Eintrage besitzen das Abfragekriterium, gewahlt werden. Nach der Uberprufung, ob der aktivierte 
Abfragedialog sinnvoll ist oder nicht, wird die Abfrage an den Benutzer ausgegeben, beispielsweise "Kennen Sie das 

20 Bundesland in dem der Zielort liegt? 0 oder "Kennen Sie die Postleitzahl (bzw. Ortsnetzkennzahl, bzw, die nachstgrdBte 
Stadt) des Zielortes?". Entsprechend der Antwort des Benutzers, wird dann der Eingabedialog fortgefuhrt. Kennt der 
Benutzer das Abfragekriterium nicht, so wird zur nachsten Abfrage verzweigt. Kennt der Benutzer das Abfragekriterium, 
so wird er aufgefordert eine Spracheingabe vorzunehmen. Bei der Bundeslandabfrage kann hierfur ein Bundesland- 
Lexikon, falls noch nicht vorhanden, generiert und als Vokabular in die Spracherkennungseinrichtung geladen werden. 

25 Neben der korrekten Bezeichnung der Bundeslander konnen auch gebrauchliche Abkurzungen, z. B. Wurttemberg 
start Baden Wurttemberg, im Bundesland-Lexikon enthalten sein. Ergibt eine Abfrage keine Verkleinerung der Eintrage 
in der Mehrdeutigkeitsliste, so wird die ursprungliche Mehrdeutigkeitsliste fur den weiteren Eingabedialog 'Mehrdeu- 
tigkeit auflosen' verwendet. Ergibt eine Abfrage eine Verkleinerung der Eintrage in der Mehrdeutigkeitsliste, so wird 
die verkleinerte Mehrdeutigkeitsliste fur den weiteren Eingabedialog 'Mehrdeutigkeit auflosen' verwendet. Besonders 

30 vorteilhaft ist es, wenn die Abfrage nach der Postleitzahl als erster Abfragedialog durchgefuhrt wird, da dieses Kriterium 
in den meisten Anwendungsfallen zu einem eindeutigen Ergebnis fuhrt. Dies gilt auch fur die Abfrage nach der Orts- 
netzkennzahl. 

[0026] Fig. 6 zeigt in schematischer Darstellung eine Ausfiihrungsform des Eingabedialogs 'Zielort buchstabieren'. 
Nach der Aktivierung des Eingabedialogs 'Zielort buchstabieren' im Schritt 2000 wird der Benutzer im Schritt 2010 

35 aufgefordert den Zielort zu buchstabieren. Im Schritt 2020 erfolgt die Spracheingabe durch den Benutzer, wobei die 
Buchstaben des Zielorts am Stuck oder in Buchstabengruppen, getrennt durch kurze Pausen, gesprochen werden 
konnen. Zusatzlich kann vorgesehen werden bestimmte Wortendungen wie -heim, -berg, -burg, -hausen, -tal usw. 
bzw. Wortanfange wie Ober-, Unter-, Frei-, Neu-, Bad- usw. als Worteingabe zuzulassen, wobei die Wortanfange und/ 
oder die Wortendungen gemeinsam mit den zulassigen Buchstaben in einem Teilwort-Lexikon enthalten sind, wobei 

40 das Teilwort-Lexikon zu Beginn des Eingabedialogs 'Zielort buchstabieren' in den Spracherkenner geladen oder akti- 
viert wird. Die eingegebenen Wortanfange, Buchstaben oder Wortendungen werden dem sprecherunabhangigen 
Spracherkenner zur Buchstabiererkennung zugefuhrt. Im Schritt 2030 wird als Ergebnis eine dritte Hypothesenliste 
hypo.3 mit Worten, welche aus den erkannten Buchstaben gebildet wurden, vom Spracherkenner zuruckgegeben. 
Danach wird im Schritt 2040 die Hypothese mit der groBten Erkennungswahrscheinlichkeit hypo.3.1 aus der dritten 

45 Hypothesenliste hypo.3 mit der Zieldatei abgeglichen. Als Ergebnis entsteht eine neue Ortsliste, welche ebenfalls nach 
Erkennungswahrscheinlichkeit sortiert ist. AnschlieBend wird durch den Schritt 2050 uberpruft, ob ein akustischer Wert 
fur den Zielort gespeichert ist Oder nicht, d. h. es wird uberpruft ob der Eingabedialog 'Zielort buchstabieren' von einem 
anderen Eingabedialog, beispielsweise 'Zielorteingabe', aufgerufen wurde Oder nicht. Ist kein akustischer Wert des 
Zielorts vorhanden, so wird im Schritt 2075 die neue Ortsliste als vierte Hypothesenliste hypo.4 zur Weiterfuhrung des 

so Eingabedialogs ubernommen und es wird zum Schritt 2080 gesprungen. Liefert die Abfrage 2050 ein positives Ergeb- 
nis, so wird im Schritt 2060 aus der neuen Ortsliste ein Ganzwort-Lexikon generiert und zur Ganzworterkennung in 
die Spracherkennungseinrichtung geladen. Dort wird anschlieBend im Schritt 2070 der gespeicherte akustische Wert 
des gewunschten Zielortes mit dem aus der Ortsliste generierten Ganzwort-Lexikon verglichen. Der Spracherken- 
nungseinrichtung liefert als Ergebnis im Schritt 2075 eine nach der Erkennungswahrscheinlichkeit sortierte vierte Hy- 

55 pothesenliste hypo.4. Diese vierte Hypothesenliste hypo.4 wird zur Weiterfuhrung des Eingabedialogs ubernommen 
und es wird der Schritt 2080 durchgefuhrt. Im Schritt 2080 wird die Hypothese mit der groBten Erkennungswahrschein- 
lichkeit hypo.4.1 aus der vierten Hypothesenliste hypo.4 mit der Abfrage an den Benutzer ausgegeben, ob die Hypo- 
these hypo.4.1 dem gewunschten Zielort entspricht Oder nicht. Beantwortet der Benutzer die Abfrage mit "Nein", so 
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ZfJTh w L ? T E,n9ab ! d,a, °9 Aus Liste auswahlen' aufgerufen. Das Ergebnis des Eingabedialogs 'Aus Liste 
auswahlen bei welchem es sich urn einen eindeuligen Zielort handelt, wird dann zur Durchfuhrung des Schrittes 21 00 
benutzt. Im Schr.tl 121 00 ermittelt das System aus der Zieldatei aller moglichen Orte eine Mehrdeutigkeitsliste, in welcher 
alto Orte aus der Zieldatei, welche in der Orthographie der Hypothese hypo.4.1 aus der vierten Hypothesenliste hypo 

^kl m ?n h?« h IS B T bedia '° 9S ' AUS USte aUSWahlen ' ents P rec ^, aufgenommen sind. Hier kann es nun 
vorkommen, daB der e.ngegebene Z,elort in der Liste mehrfach vorkommt, beispielsweise aufgrund des "Neustadt- 
Problems , und som.t nicht eindeutig ist. Deshalb wird im Schritt 21 1 0 uberpruft, ob der Zielort eindeutig ist Oder nicht 
Kommt der Zielort nur einmal vor, so wird der Eingabedialog mit dem Schritt 2130 fortgefiihrt. Ist der Zielort nicht 
e.ndeut.g so w.rd gemaB Schritt 2120 der Eingabedialog 'Mehrdeutigkeit auflosen' aufgerufen. Das Ergebnis des Ein- 
gabedialogs Mehrdeutigkeit auflosen' wird danach an den Schritt 2130 iibergeben. Im Schritt 2130 wird der Erkannte 
Zielort mi bestimmten Zusatzinformationen, beispielsweise Postleitzahl und Bundesland, verifiziert, in dem der Be- 
nder gefragt w.rd ob der eingegebene Zielort richtig ist Oder nicht. Beantwortet der Benutzer die Abfrage 2130 mit 
Ne.n so wird der Benutzer im Schritt 2150 daruber informiert, daB der Zielort nicht gefunden werden konnte und der 
E ngabediatog w.rd beendet. Beantwortet der Benutzer die Abfrage 21 30 mit Ma', so wird der erkannte Zielort im Schritt 
2140 zwischengespeichert und zur Uberpriifung 350 gemaB Fig. 1 verzweigt. 

[0027] Fig. 7 zeigt in schematischer Darstellung eine Ausfuhrungsform des Eingabedialogs 'Grobzieleingabe' In 
d.esem E.ngabed.alog wird der Benutzer aufgefordert eine ihm bekannte groBere Stadt in der Nahe des eigentlichen 
Z.elortes als Grobziel zu sprechen, wobei das Grobziel im Grund-Lexikon enthalten sein sollte. Nach der Aktivierung 
des Eingabedialogs Grobzieleingabe' im Schritt 3000 wird im Schritt 3010 ein Eingabedialog 'Grobziel eingeben' auf 
fL I L £ Eln 9 abed ' al °9 ' Grob2iel ei "9eben' im Schritt 301 0 ergibt sich nahezu der gleiche Ablauf wie beim 
E.ngabed.alog Z.elorte.ngabe'. Bei der Eingabeaufforderung wird jedoch im Gegensatz zum Schritt 1020 gemaB Fig 
2 Oder F.g. 3 der Benutzer nicht zur Eingabe des Zielortes sondern zur Eingabe des Grobziels aufgefordert. Nach der 
Durchfuhrung des Teileingabedialogs 'Grobziel eingeben' gemaB Schritt 3010 wird das Ergebnis des Eingabedialogs 
Grobz.el e.ngeben zur Fortfuhrung des Eingabedialogs 'Grobzieleingabe' an den Schritt 3300 iibergeben Im Schritt 
3300 werden m Ortsnamen im Umkreis des als Ergebnis des Eingabedialog 'Grobziel eingeben' ubergebenen Grob- 

, Z un 0 S ^TrtJ T m iSt abhan9i9 V ° n d6r Lei stungsfahigkeit der verwendeten Spracherkennungseinrich- 
tung und der Ubertragungskapaz,tat zwischen der mindestens einen Datenbasis und der Spracherkennungseinrich- 
Ujng. Be. dem beschnebenen Ausfuhrungsbeispiel wird der Parameter m auf 1500 gesetzt. Aus diesen 1500 Ortsna- 
men, welche Teil der Zieldatei sind, wird im Schritt 331 0 ein Feinziel-Lexikon generiert und als Vokabular in die Sprach- 
e Jennungse,nr.chtung geladen. AnschlieBend wird im Schritt 3320 der Eingabedialog 'Zielorteingabe' gemaB Fig 2 
Oder F^g. 3 durchgefuhrt. M.t dem Unterschied, daB der Schritt 1010 nicht ausgef uhrt wird, da das notwendige Vokabular 
zur Erkennung des Zielortes schon in der Spracherkennungseinrichtung geladen ist. Zur Abkurzung des Eingabedia- 

Z£™ k h 6 '? 9 ,t' S , ,eS ab6r 3UCh vors,ellbar ' da3 im Eingabedialog 'Grobziel eingeben' eine verkurzte Ausfiihrung 
des E.ngabed.alogs Zielorteingabe' gemaB Fig. 3 durchgefuhrt wird. In der verkiirzten Ausfiihrung des Eingabedialogs 
Z.elorte,ngabe gemaB Fig. 3 wird auf den Eingabedialog 'Zielort buchstabieren' verzichtet und nach der Abfrage 1 075 
S,; 9 H 3 ™ Cht der Ein Sfedialog 'Zielort buchstabieren' aufgerufen sondern dem Benutzer mittels Sprachausgabe 
m.tgete.lt, daB das Grobz.el nicht gefunden werden konnte und der Eingabedialog 'Grobzieleingabe' wird beendet Zur 
Beschleun.gung des Eingabedialogs kann fur den Eingabedialog 'Grobziel eingeben' ein Grobziel-Lexikon generiert 
werden und anschl.eBend als Vokabular in die Spracherkennungseinrichtung geladen oder aktiviert werden, wobei 

IS fit T anSte " e d6r 1000 9r6Bten 0rte des Gr ^-Lexikons nur die 400 groBten Orten der Bundesre- 
pubhk enthalt Dadurch ergibt sich im Schritt 1150 gemaB Fig. 3 in den meisten Anwendungsfallen eine wesentlich 
kurzere Mehrdeut.gkeitsliste. Zusatzlich kann auch auf den Eingabedialog 'Mehrdeutigkeit auflosen' verzichtet Sen 
Anstelle des Eingabedialogs 'Mehrdeutigkeit auflosen' wird der Eingabedialog 'Aus Liste auswahlen' aufgerufen urn 
den Benutzer das gewunschte Grobziel auswahlen zu lassen oder es werden nur die beiden Orte mit der groBten 
Einwohnerzahl ,n der Mehrdeutigkeitsliste an den Benutzer zur endgiiltigen Auswahl des Grobziels ausgegeben Wur- 
zlSnuSgLThT 1 ' 61 *° Eingabedial ° 9 ' Gr obzieleingabe' beendet und in den Warte- 

F lt 8 Zei9, l n s f ematiscner Darstellung eine Ausfuhrungsform des Eingabedialogs 'Adresse speichern' 
Nach der Akt.v.erung des E.ngabedialogs 'Adresse speichern' im Schritt 7000 wird im Schritt 701 0 uberpruft ob bereits 
eine Z.eladresse eingegeben wurde. Ergibt die Uberpriifung 7010 ein positives Ergebnis, so wird zur Abfrage 7020 
f 6 ' 9 *f« rS uber P'tf"ng 7010 ein negatives Ergebnis, so wird zum Schritt 7030 verzweigt. Im Schritt 7020 
w.rd e,ne Abfrage an den Benutzer ausgegeben, ob er die aktuelle Zieladresse speichern will oder nicht. Beantwortet 
der Benutzer die Abfrage mit "Ja". so wird zum Schritt 7040 verzweigt. Beantwortet der Benutzer die Abfrage mit «Nein" 
so w,rd zum Schntt 7030 verzweigt. Im Schritt 7030 wird ein Eingabedialog 'Adresse eingeben' aufgerufen. Der Ein- 

aus, welchen der vier Eingabedialoge 'Zielortein- 
gabe Grobz.ele.ngabe , Z.elort buchstabieren' oder 'Indirekte Eingabe' der Benutzer zur Eingabe der Zieladresse 
welche gespeichert werden soil, durchfuhren mochte. Die Auswahl des gewiinschten Eingabedialogs kann dabei ana- 
log zum E.ngabed.alog Aus Liste auswahlen' durchgefuhrt werden. Zudem ist es vorstellbar, daB der Eingabedialog 



10 



EP0 865 014B1 

•Adresse eingeben' direkt nach der Aktivierung einen der vier Eingabedialoge zur Spracheingabe eines Zielortes ('Ziel- 
orteingabe', 'Zielort buchstabieren', 'Grobzieleingabe* Oder 'Indirekte Eingabe') aufruft, ohne eine Abfrage an den Be- 
nutzer auszugeben. Nach der Spracheingabe eines Zielortes wird analog zu den Schritten 350 und 400 gemaB Fig. 1 
uberpruft ob, ein StraBenname eingegeben werden kann und wenn ja, ob ein StraBenname eingegeben werden soil 

s oder nicht. Wird kein StraBenname eingegeben, so wird der Schritt 450 gemaB Fig. 1 durchgefuhrt. AnschlieBend wird 
die eingegebene Zieladresse als Ergebnis des Eingabedialogs 'Adresse eingeben' zur Weiterfuhrung des Eingabedia- 
logs 'Adresse speichern' zwischengespeichert. Im Schritt 7040 wird der Benutzer aufgefordert ein Schlusselwort zu 
sprechen, welches der eingegebenen Zieladresse zugeordnet werden soil und unter wetchem die Zieladresse im per- 
sonlichen AdreBregister abgelegt werden soil. Das vom Benutzer im Schritt 7050 gesprochene Schlusselwort wird im 

10 Schritt 7060 als akustischer Wert <Schlusselwort> dem sprecherabhangigen Zusatz-Spracherkenner zugefuhrt und 
gegebenenfalls durch mehrmaliges, insbesondere zweimaliges, Sprechen verif iziert. AnschlieBend wird im Schritt 7070 
die eingegebene Zieladresse dem Schlusselwort zugeordnet und der akustische Wert <Schlusselwort> im personlichen 
AdreBregister gespeichert, Der Benutzer wird mittels einer Sprachausgabe im Schritt 7080 informiert, daB die Ziel- 
adresse unter dem eingegebenen <Schlusselwort> gespeichert wurde. AnschlieBend wird im Schritt 7090 der Einga- 

15 bedialog 'Adresse speichern' beendet und zum Wartezustand 0 gemaB Fig. 1 verzweigt. Mittels dem nicht detailliert 
dargestellten Eingabedialog 'Adresse abrufen', kann die gespeicherte Zieladresse durch eine Spracheingabe des zu- 
geordneten Schlussetwortes, welches zur Erkennung dem sprecherabhangigen Spracherkenner zugefuhrt wird, ab- 
gerufen und an das Zielfuhrungssystem ubergeben werden. Wurde die Schlusselworte in die Ortsliste aufgenommen, 
dann ist auch ein Buchstabieren des Schlusselwortes moglich, wenn das Schlusselwort als Ganzworteingabe nicht 

20 erkannt wurde. 

[0029] Fig. 9 zeigt in schematischer Darstellung eine Ausfuhrungsform des Eingabedialogs 'StraBeneingabe'. Nach 
der Aktivierung des Eingabedialogs 'StraBeneingabe' im Schritt 5000 wird im Schritt 5010 uberpruft, ob bereits ein 
Zielort eingegeben wurde Oder nicht. Ergibt die Uberprufung 5010 ein positives Ergebnis, so wird der eingegebene 
Zielort zur Weiterfuhrung des Eingabedialogs 'StraBeneingabe' verwendet und zum Schritt 5040 verzweigt. Ergibt die 

25 Uberprufung 501 0 ein negatives Ergebnis, so wird im Schritt 5020 eine Abfrage an den Benutzer ausgegeben, ob sich 
die StraBe in dem aktuellen Ort befindet Oder nicht. Den aktuellen Ort ermittelt das Zielfuhrungssystem mit Hilfe eines 
aus dem Stand der Technik bekannten Ortungsverfahren, beispielsweise mittels dem Global Positioning System (GPS). 
Beantwortet der Benutzer die Abfrage mit "Ja", so wird der aktuelle Ort als Zielort zur Weiterfuhrung des Eingabedialogs 
'StraBeneingabe' verwendet und zum Schritt 5040 verzweigt. Beantwortet der Benutzer die Abfrage mit "Nein" so wird 

30 zum Schritt 5030 verzweigt. Im Schritt 5030 wird ein Eingabedialog 'Zielort eingeben' aufgerufen. Der Eingabedialog 
'Zielort eingeben' gibt analog zum Eingabedialog 'Adresse eingeben' eine Abfrage an den Benutzer aus, welchen der 
vier Eingabedialoge 'Zielorteingabe', 'Grobzieleingabe', 'Zielort buchstabieren' oder 'Indirekte Eingabe' der Benutzer 
zur Eingabe der Zieladresse, welche gespeichert werden soli, durchfuhren mochte. Die Auswahl des gewiinschten 
Eingabedialogs kann dabei analog zum Eingabedialog 'Aus Liste auswahlen' durchgefuhrt werden. Zudem ist es vor- 

35 stellbar, daB der Eingabedialog 'Zielort eingeben' direkt nach der Aktivierung, ohne eine Abfrage an den Benutzer 
auszugeben, einen der vier Eingabedialoge zur Spracheingabe eines Zielortes aufruft. Nach der Durchfuhrung des 
Eingabedialogs 'Zielort eingeben' wird als Ergebnis der eingegebene Zielort zur Weiterfuhrung des Eingabedialogs 
'StraBeneingabe' verwendet und zum Schritt 5040 verzweigt. Im Schritt 5040 wird uberpruft, ob die Anzahl der StraBen 
des gewunschten Zielortes groBer als m ist oder nicht. Der Parameter m-ist dabei von der Art der Spracherkennungs- 

40 einrichtung abhangig. Bei dem beschriebenen Ausfuhrungsbeispiel, wurde m = 1 500 gesetzt. Ist die Anzahl der StraBen 
des gewunschten Zielortes kleiner als m, so wird eine StraBenliste des gewunschten Zielortes zur Weiterfuhrung des 
Eingabedialogs 'StraBeneingabe' an den Schritt 5060 ubergeben. Ist die Anzahl der StraBen des gewunschten Zielortes 
groBer als m, so wird zum Schritt 5050 verzweigt. Im Schritt 5050 wird ein Eingabedialog 'Umfang begrenzen' aktiviert, 
mit dem Ziel den Umfang der StraBenliste auf weniger als m Eintrage von StraBennamen zu reduzieren. Zu diesem 

45 Zweck kann der Benutzer aufgefordert werden verschiedene Auswahlkriterien, beispielsweise den Namen eines Stadt- 
teils, die Postleitzahl oder den Anfangsbuchstaben des gewunschten StraBennamens, mittels Spracheingabe einzu- 
geben. Analog zum Eingabedialog 'Mehrdeutigkeit auflosen* konnen die Auswahlkriterien beliebig kombiniert werden. 
Der Eingabedialog 'Umfang begrenzen' wird beendet, wenn der Umfang auf m oder weniger StraBennamen reduziert 
wurde. Als Ergebnis des Eingabedialogs wird die reduzierte StraBenliste an den Schritt 5060 ubergeben. Im Schritt 

so 5060 wird aus der ubergebenen StraBenliste ein StraBen-Lexikon generiert und in die Spracherkennungseinrichtung 
geladen. Im Schritt 5070 wird der Benutzer aufgefordert den StraBennamen zu sprechen. Die Weiterfuhrung des Ein- 
gabedialogs 'StraBenname' ist nun analog zum Eingabedialog 'Zielorteingabe' gemaB Fig. 3. Die vom Benutzer ge- 
sprochene "StraBe_1 " (Schritt 5080) wird als akustische Wert <StraBe_1 > an die Spracherkennungseinrichtung uber- 
geben. Als Ergebnis liefert die Spracherkennungseinrichtung eine funfte Hypothesenliste hypo.5 zur Weiterfuhrung 

55 des Eingabedialogs 'StraBeneingabe' zuruck (Schritt 5090). Im Schritt 5100 wird der StraBenname mit der groBten 
Erkennungswahrscheinlichkeit hypo.5.1 an den Benutzer mit der Abfrage ausgegeben, ob <hypo.5. 1 > der gewunschte 
StraBenname ist oder nicht. Beantwortet der Benutzer die Abfrage 51 00 mit "Ja", so wird zum Schritt 51 40 verzweigt. 
Beantwortet der Benutzer die Abfragte 5100 mit "Nein*, so wird der akustische Wert <StraBe_1 > im Schritt 5110 ge- 
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speichert. AnschlieBend wird im Schritt 5120 der StraBenname mit der zweitgroBten Erkennungswahrscheinlichkeit 

wiw die Abfrage 5120 mit Ja beantwortet, so wird zum Schritt 5140 verzweigt. Beantwortet der Benutzer die Abfraae 
mrt Nein so wird ,m Schr.tt 5130 ein Eingabedialog 'StraBe buchstabieren' aufgerufen. Der Eingabed^q sSe 

zTf^ZT T T S , Chri c 21 °° ana ' 09 2Um Einabedia '°9 ' Zielort buchstabieren" und JJSSSSSSS 
zur F.g. 6 bere.ts abgehandelt. Es mussen nur die in der Beschreibung verwendeten Begriffe Zielort ^neue Sste 
s.nngemaB durch die Begriffe StraBenname, neue StraBenliste ersetzt werden. Anstelle des Schr to 21 00 oemfildem 
Einol e H ° 9 Z : l0rt n bu h chstabiere^ • wird *r E-gabedialog "StraBe buchstabieren' been^det und das Erg^bnis^es 
Emgabedialogs 'StraBe buchstabieren' zur Weiterfuhrung des Eingabedialogs 'StraBeneingabe' an den sXS sfS 

Sol" 7 m , S rt C ' lrit, 'I-? 6rmit,elt ^ SyS,6m 3US d6r Stra3en,iSte ' W6lche a " e ^ StraBe^aS dls ge 

^nschten Z-elortes enthalt, e.ne Mehrdeutigkeitsliste, in welcher alle StraBennamen aus der StraBenliste welSe in 

der Orthograph.e der Hypothese hypo.5.1 bzw. der Hypothese hypo.5.2 aus der ftinften Hypothesenfete hvTo stai 
Z oSr S ^ ' S ^ a buchstabieren' entsprechen, Ml«»JSX5^^S 

ndaUUB ^ ° d6r niChl ' St d6r ein9egebene St ^™ame einde^ s 0 w'd 
*i«n f - w 1 I ! 9 9 Ab,ra9e 6in negat,VeS Er 9 ebnis - 50 wird 2um Schritt 5160 verzweigt Im Schritt 

51 60 w,rd uberpruft ob die Mehrdeutigkeitsliste mehr als k Eintrage umfaBt Oder nicht. UmfaBt die M^u iateftelSe 
k Oder wemger Em.rage, so wird zum Schritt 5190 verzweigt. UmfaBt die Mehnl^l^£tr^kS5SIi 
zum Schntt 51 70 verzweigt. Im Schritt 51 70 wird uberpruft ob die MehrdeutigkeiJdurch Emgabe von zuShen 
tuo^T n T b t iSpie h ISWeiSe der Post,eit2ahl ^s Stadtteils, aufgelos, werden kann. T 9 bt 7e SSS5S 
nl° ' P °T?, 9ebn ' S • S ° Wifd im Schritt 5180 ein Ein 9abedialog 'StraBenmehrdeutigkeit auflosen' aXufen 
Dieser E.ngabedialog verlauft analog zum Eingabedialog 'Mehrdeutigkeit auflosen' gemaB Fig 5 /teSfra^SZn' 

siVJnIrH 6 ?! 1 f er „ der Stadt,ei ' ein9e9eben Werden - AnschtieBend wird das Ergebnis des E^Xialog 
tt T a " ,l0Sen ZUf Wei,erf£ihrun 9 *s Eingabedialogs 'StraBeneingabe' an den Sc S uber 
geben. Ergibt die Uberprufung 5170 ein negatives Ergebnis, so wird zum Schritt 519 Verzweigt m &S l 
der E.ngabedialog 'Aus Liste auswahlen' aktiviert und durchgefiihrt. Das Ergebnis des EingaSaloos 'Aus Lll Z 
wah.en' wird zur Weiterfuhrung des Eingabedialogs 'StraBeneingabe' an den Schritt tS^S^£^S^ 

^;ssscrcr das Er9ebnis — - - — n ii:s° 

SeSe^SK 

dungsgemaBen Verfahrens ein Sprachdialogsystem 1, ein Zielfuhrungssystem 2 und eine extern Da enbal 2 
weteher beispielsweise die Zieldatei abgespeichert ist. Das Sprachdialogsystem 1 u^SSS^iif 
nchtung 7 zum Erkennen und Klassifizieren von mittels einem Mikrophon 5 von einem Benutzer Sebene" toST 
auBerungen eine Sprachausgabeeinrichtung 10 die mittels einem Lautsprecher 6 SpSu^T n TeSn i' 
nu^er ausgeben kann. eine Dialog- und Ablaufsteuerung 8 und eine interne Datenbasis 9, in !^b££Z£ 
3 fn dS. T d0S 9 f Pe J Chert Sind " D3S ZielfQhr -^ystem 2 umfaBt einen internen JSSSSZ 
IT f Sp,elsweise das Grundlexikon abgelegt ist, und eine optische Anzeigevorrichtung 11 Mittete der D^aloa 
und Ablaufsteuerung 8 konnen uber entsprechende Verbindungen 12, welche auch als Da?enbu7ausae«hrtt 9 n 
onnen, Daten zwischen den einzelnen Komponenten der Vorrichtung ausgetausc^erdea ° " 

bSU fdargesS. 9 * bCSChriebenen Ei "^bedia.oge werden in den Tabe.len 2 bis 6 verschiedene Einga- 



Tabelle 2: 


Dialogbeispiel "Zielorteingabe mit Auflosung von Mehrdeutigkeiten"- 


System 


Benutzer 


Anmerkung 




betatigt PTT-Taste 


Der Benutzer aktiviert das 
Sprachdialogsystem 


Beep 








"Zielorteingabe" 


Es wird der Eingabedialog 
'Zielorteingabe' aktiviert 


I "Bitte Ortsnamen sprechen" 


"Neunkirchen" 
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Tabelle2: (fortgesetzt) 





Dialogbeispiel "Zielorteingabe mit Auflosung von Mehrdeutigkeiten 0 : 




System 


Benutzer 


Anmerkung 


5 




betatigt PTT-Taste 


Der Benutzer aktiviert das 
Sprachdialogsystem 


10 






Der Spracherkennungseinrichtung 
vergleicht die akustische Eingabe 
mit dem im sprecherunabhangigen 
Spracherkenner aktivierten 
Vokabular und gibt das Ergebnis mit 
der groBten 

Erkennungswahrscheinlichkeit aus. 


15 


"Neunkirchen ist das richtig?" 






20 




"Ja" 


Das Sprachdialogsystem sucht in 
der Zieldatei alie Eintrage mit dem 
Ortsnamen 'Neunkirchen' und 
erzeugt intern zu weiteren 
Verarbeitung eine 
Mehrdeutigkeitsliste gemaR Tabelle 
2a. 


25 
30 


"Neunkirchen wurde 18 mal in 6 
Bundeslandern gefunden. 

Mochten Sie in die GroBstadt 
Neunkirchen im Saarland?" 




Das System weist den Benutzer auf 
die Mehrdeutigkeit hin und schlagt 
als Zielort den Ort mit den meisten 
Einwohnern vor, da die 
Wahrscheinlichkeit, daB dieser 
gemeint war am groBten ist. 






Antwortet der Benutzer mit "Ja", so j 
wird Neunkirchen im Saarland als 
Zielort festgelegt. 


35 
40 
45 






Antwortet der Benutzer mit "Nein", 
dann muB zur Auflosung der 
Mehrdeutigkeit nach weiteren 
Abfragekriterien gefragt werden. 
Mogliche Abfragekriterien sind: 
Postleitzahl, Ortsnetzkennzahl oder 
das Bundesland des gesuchten 
Ortes. Da hier die Postleitzahl oder 
die Ortsnetzkennzahl am 
schnellsten zum Ziel fuhren wurde, 
wird zuerst nach ihnen gefragt. 




"Nein" 






"Kennen Sie die Postleitzahl von 
Neunkirchen?" 


"Nein" 




50 


Kennen Sie die Ortsnetzkennzahl 
von Neunkirchen? 


"Nein" 






"Kennen Sie das Bundesland in dem 
Neunkirchen liegt?" 


"Ja" 




55 


"In welchem Bundesland liegt 
Neunkirchen?" 


"Bayern" 
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Tabelle 2: (fortgesetzt) 
Dialogbeispiel "Z.elorteingabe mit Auflosung von Mehrdeutiokeiten": 

S ^ I Benutzer" 



betatigt PTT-Taste 



"Neunkirchen gibt es sechs mal in 
Bayern. Sollen die Orte vorgelesen 
werden?" 



"Ja' 



"Bitte wahlen Sie aus den folgenden 
Orten: 

Neunkirchen 

1. am Brand im Lkr. Forchheim 

2. am Sand im Lkr. Nurnberg-Land 

3. im Lkr. Miltenberg 

4. bei Leutershausen im Lkr. 
Ansbach, weiter" 



"Neunkirchen 

1 . bei Teisendorf im Lkr. 
Berechtesgadener Land 

2. bei Weidenberg im Lkr. Bayreuth' 



'Weiter* 



Anmerkung 

Der Benutzer aktiviert das 
Sprachdialogsystem 



Stehen nur noch wenige Orte zur 
Auswah I f ragt das System , ob die Ort 
vorgelesen werden sollen. 
Gleichzeitig zeigt das System die 
noch moglichen Orte auf der 
Anzeigeeinrichtung des 
Zielfindungssystems an. 

(Zusatzlich denkbar: Stehen nur 
noch zwei Orte zur Auswahl liestdas 
System die beiden Orte vor und 
fordert den Benutzer auf einen der 
beiden Orte als Zielort 
auszuwahlen.) 



Die nachste Seite wird angezeigt 



Zur besseren Ubersicht und urn das 
Vokabular klein zu halten werden die 
angezeigten Orte auf jeder Seite mit 
eins beginnend numeriert 



'Zielfuhrung programmiert auf 
Neunkirchen bei Weidenberg im Lkr. 
Bayreuth in Bayern" 



"Nummer zwei" oder "Neunkirchen 
bei Weidenberg" 



Damit ist der Zielort festgelegt und 
die zum Zielort gehorenden 
StraBennamen konnen bei Bedarf 
geladen werden. 



Lfd. -Nr. 
1 



PLZ. 

66510-66589 
53819 



57290 



Ortsnk. 

06821 

02247 



02735 



Tabelle 2a 
Mehrdeutigkeitsliste 

Namenszusatz 



Bundesland 
SL 
NW 



NW 



Seelscheid 



Kreis 

Neunkirchen 
Rhein-SiegKreis 



Siegen-Wittgenstein 



Einwohn. 
51863 
17360 



14804 
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Tabelle2a (fortgesetzt) 



Mehrdeutigkeitsliste 


Lfd. -Nr. 


PLZ. 


Ortsnk. 


Bundesland 


Namenszusatz 


Kreis 


Einwohn. 


• ■ • 










« ■ ■ 


• ■ ■ 


17: 


83317 


08666 


BY 


am Teisenberg 


Berchtesgadener Land 


0 


18: 


95466 


09278 


BY 




Bayreuth 


0 



10 



Tabelle 3: 





Dialogbeispiel "Kombination aus 'Zielorteingabe' und 'Zielort buchstabieren' ohne Mehrdeutigkeit" 


15 


System 


Benutzer 


Anmerkung 




betatigt PTT-Taste 


Der Benutzer aktiviert das 
Sprachdialogsystem 




Beep 






20 




"Zieleingabe" 






"Bitte Ortsnamen sprechen" 






25 
30 


- 


"Elmenthall" 


Der Benutzer spricht den Ortsnamen, 
von dem er irrtumlich annimmt, da(3 
dieser im Grundvokabular enthalten 
ist. Da Elmenthal im Grundvokabular 
nicht vorkommt, kommt es zu einer 
Falschmeldung. (Ergebnis aus dem 
sprecherunabhangigen 
Spracherkenner: 

1 . Hypothese: Emmerthal 

d. Hypothese. keine) 


35 


"Emmerthal. ist das richtia?" 




V/orif ikatinn Hoc 

Erkennungsvorganges 






"Nein" 






"Bitte Ortsnamen noch mal sprechen" 






40 




"Elmenthal" 


Es kommt erneut zur 
Falscherkennung. (Ergebnis aus dem 
sprecherunabhangigen 
Spracherkenner: 

1 . Hypothese: Emmerthal 


45 






2. Hypothese: Elmshorn) 

In diesem Fall wird die zweite 
Hypothese uberpruft, weil die erste 
Hypothese schon bei der 


50 






vorangegangenen Verifikation vom 
Benutzer zuruckgewiesen wurde. 




"Elmshorn ist das richtig?" 




Verifikation der 2. Hypothese 



55 
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Tabelle 3: (fortgesetzt) 



Dialogbeispiel "Kombination aus 'Zielorteingabe' und 'Zielort buchstabieren' ohne Mehrdeutigkeit" 



"Nein° 



"Bitte buchstabieren Sie den 
Ortsnamen" 



n E-L-M-E-N n #Pause# "T-H-A-L" 



Die Spracheingabe wird nun fur einen 
spateren Erkennungsversuch 
zwischengespeichert. Es wird der 
Eingabedialog 'Zielort buchstabieren 
aufgerufen. 

Der Benutzer spricht die Buchstaben 
verbunden ein. Er hat die Moglichkeit 
die Buchstaben in 
Buchstabengruppen getrennt durch 
kleine Pausen zu sprechen. Nach 
einer langeren Pause bricht der 
Erkenner die Eingabe ab und gibt eine 
Hypothesenliste aus. (Ergebnis aus 
der Buchstabiererkennung: 

1. Hypothese Ulmenthal 

2. Hypothese Ulmenphal 
•■■) 

Das Sprachdialogsystem berechnet 
aus der ersten Hypothese eine Liste 
von Orten, die als mbgliche Zielorte in 
Frage kommen: 

Elmenthal 8.06365 

Blumenthal 12.4422... 



"Elmenthal, ist das richtig' 



"Zielfuhrung programmiert auf 

Elmenthal im Landkreis 

Schmalkalden-Meiningen in 
Thuringen" 



"Ja" 



Aus diesen Orten wird ein neues 
Ganzwort-Lexikon generiert 
(GroBenordnungca. 100Worte)und in 
den Erkenner geladen. 

Die vorher abgespeicherte 

Spracheingabe 'Blmenthal' dient nun 
als neue Spracheingabe. Da jetzt der 
gesuchte Ort im Vokabular enthalten 
ist, besteht die Moglichkeit den Ort 
richtig zu erkennen 



Da Elmenthal in der erzeugten 
Mehrdeutigkeitsliste eindeutig ist, 
braucht nicht weiter verifiziert zu 
werden. 



Damit ist der Zielort festgelegt und die 
zum Zielort gehorenden 
StraBennamen konnen bei Bedarf 
geladen werden. 
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Tabelle 4: 



Dialogbeispiel 'Grobzieleingabe' ohne Mehrdeutigkeit 


System 


Benutzer 


Anmerkung 




betatigt PTT-Taste 


Der Benutzer aktiviert das 
opracnaiaiogsystem 


Beep 








"Grobziel" 




"Bitte Grobzie! sprechen" 








"Stuttgart" 




"Stuttgart ist das richtig?" 




Verifikation des Erkennungsergebnisses 




"Ja" 




"Lexikon fur Stuttgart wird geladen" 




Das Lexikon mit 1500 Ortsnamen im 
Umkreis von Stuttgart wird generiert und in 
die Spracherkennungseinrichtung geladen. 

fl cx c 1 ovilffin Lfonn nQnohonanfollc 01 tr*Y\ 
Udo l_cAII\Ull KcUIll ycytJUci ItJl llallo aUCM 

vorberechnet auf der Datenbasis liegen. 
Nach dem Laden kann der gewunschte 
Zielort eingegeben werden. 


"Bitte Ortsnamen sprechen" 








"Wolfschlugen" 




"Wolfschlugen ist das richtig?" 




Verifikation des Erkennungsergebnisses 




°Ja" 




"Zielfuhrung wird programmiert auf 
Wolfschlugen im Landkrels Esslingen in ' 
Baden-Wurttemberg" 




Da Wolfschlugen eindeutig ist, mussen keine 
weiteren Abfragen durchgefuhrt werden und 
das Zielfiihrungssystem kann bei Bedarf die 
evtl. vorhandenen StraBennamen von Wolf 
schlugen laden. 









10 



15 



20 



25 



30 



35 



Tabelle 5: 



40 


Dialogbeispiel 5 'StraBeneingabe' 




System 


Benutzer 


Anmerkung 


45 




betatigt PTT-Taste 


Der Benutzer aktiviert das 
Sprachdialogsystem 


Beep 










"StraBeneingabe" 




50 


"Mochten Sie einen StraBennamen fur 




Das System fragt, ob die aktuelle Stadt als 
Zielort korrekt 




Stuttgart eingeben?" 




ist. Wird hier mit "Nein" geantwortet muB 
zunachst ein Dialog zur Eingabe eines 
Zielortes aufgerufen werden 
(Eingabedialoge 1-4) 
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Dialogbeispiel 5 'StraGeneingabe' 



Tabelle 5: (fortgesetzt) 



■Ja" 



"Bitte sprechen Sie den 
Anfangsbuchstaben des StraGennamens!" 



"P" oder "P wie 
Paula" 



Der Benutzer mochte einen StraGennamen 
fur Stuttgart eingeben. Die Anzahl der 
StraGennamen fur diese Stadt liegt bei ca. 
3200 Namen und ubersteigt daher die 
maximale VokabulargroBe des 
Spracherkennersvon ca. 1500 Worten. Der 
Benutzer wird daher aufgefordert, den 
Anfangsbuchstaben des StraGennamen zu 
sprechen urn danach aus alien 
StraGennamen mit diesem 
Anfangsbuchstaben ein StraGen-Lexikon 
zu generieren und In die 

Spracherkennungseinrichtung zu laden. 
Moglich ware hier auch die Eingabe eines 
Buchstabenbereichs wie z.B. A bis E, F bis 
J usw.. Dann muGten in der Regel aber 
mehr Daten geladen und berechnet 
werden. AuBerdem stiege bei groGerem 
Vokabular die 

Vertauschungswahrscheinlichkeit. 
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Tabelle 5: (fortgesetzt) 





Dialogbeispiel 5 'Stra3eneingabe' 


5 

10 

15 

20 

25 


"Bitte wahlen Sie aus den Alternative^ 




Da die Vertauschungswahrscheinlichkeit 
bei den Buchstaben sehr hoch ist, gibt der 
Erkenner ein Hypothesenauswahl auf der 
Anzeigeeinrichtung des 
Zielfuhrungssystems und/oder als 
Sprachausgabe aus. Uber die 
vorangestellte Nummer kann der Benutzer 
den gewunschten Buchstaben auswahlen 
oder eine neue Eingabe anfordern, wenn 
der gesprochene Buchstabe nicht dabei ist. 
Gibt der Erkenner nur eine Alternative 
zuruck, bietet das System diese als 
erKanmen MniangsDucnsiaDen oem 
Benutzer zur Verifikation an. Bei der 
zweiten Eingabeart "P wie Paula' ist die 
Gefahr der Falscherkennung erheblich 
qerinqer, aber die Kennworter fur die 
einzelnen Buchstaben mussen dem 
Benutzer bekannt sein. Anzeige auf dem 
Display und/oder als Sprachausgabe bei 
mehrals einer Buchstabenhypothese: 






1 . W wie Wilhelm 

2. G wie Gustav 

3. B wie Berta 


30 






4. E wie Emil 

5. D wie Dora 

6. P wie Pauls 
Fehler 


35 




"Nummer sechs" 




40 
45 


"StraBenname mit 'P wie Paula' werden 
geladen" 




Das Sprachdialogsystem erzeugt in diesem 
Fall eine StraBenliste mit 87 StraBennamen 
mit dem Anfangsbuchstaben 'P\ Da uber 
den Anfangsbuchstaben die Anzahl der zu 
ladenden Daten gering ist, wird durch diese 
Eingabe die Wartezeit fur den Benutzer auf 
ein Minimum begrenzt. AnschlieBend wird 
aus der StraBenliste ein StraBen-Lexikon 
fur den sprechehangigen Spracherkenner 
generiert und der Benutzer wird 
aufgefordert den StraBennamen zu 

cnrpf*hpn 


50 


"Bitte sprechen Sie den StraBennamen!" 










"Pflasteracker straBe" 






'PflasterackerstraBe ist das richtig?" 




Verifikation des StraBennamens. 






"Ja" 




55 


"Zielfuhrung programmiert auf 'Stuttgart, 
PflasterackerstraBe" 








• * » 


• < • 


• ■ • 
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Tabelle 6: 



Alternativer Eingabedialog 'StraGeneingabe' 



System 



Beep 



"Mochten Sie einen StraGennamen 
fur Reutlingen eingeben?" 



Benutzer 
betatigt PTT-Taste 



'StraGeneingabe' 



"Ja" 



"Bitte sprechen Sie den 
StraGennamen!" 



"Bitte buchstabieren Sie den 
StraGennamen" 



"BismarkstraGe" 



"B-l-S-M-A-R-K" #Pause# 
"STRAGE" Oder alternativ "B-l-S-M- 



Anmerkung 



Der Benutzer aktiviert das 
Sprachdialogsystem 



Das System fragt, ob die aktuelle 
Stadt als Zielort korrekt ist. Wird hier 
mit "Nein" geantwortet muG 
zunachst ein Dialog zur Eingabe 
eines Zielortes aufgerufen werden 
(Eingabedialoge 1-4) 

Der Benutzer mdchte einen 
StraGennamen fur Reutlingen 
eingeben. Die Anzahl der 
StraGennamen fur diese Stadt liegt 
unter 1500 StraGennamen und 
ubersteigt daher die maximale 
VokabulargroGe des 
Spracherkenners von ca. 1500 
Worten nicht. 



Der akustische Wert 
<BismarkstraGe> der 
Spracheingabe wird gespeichert 
und eine ASCII-Liste mit den 
StraGennamen des Zielortes von 
der Datenbasis geladen. 



Der Benutzer spricht die 
Buchstaben verbunden Oder in 
Buchstabengruppen getrennt durch 
eine kurze Pause ein. Alternativ 
kann derZusatz '-straGe', '-gasse', 
weg' weggelassen werden. Nach 
einer langeren 
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Tabelte 6: (fortgesetzt) 





Alternativer Eingabedialog 'StraBeneingabe' 


5 

10 

15 

20 

25 




A-R-K" 


Pause bricht die 

Spracherkennungseinrichtung die 
Eingabe ab und berechnet als 
ErgebniseineHypothesenliste. Nun 
kann aus der 1 . Hypothese, oder 
aus den ersten n Hypothesen, aus 
dieser Hypothesenliste eine 
StraBenliste mit den 
StraBennamen, welche als 
eingegebene StraBe in Frage 
kommen, durch Abgleich mit der 
ASCII-Liste auf der Datenbasis 
erzeugt werden. Aus dieser 
StraBenliste wird ein StraBen- 
Lexikon generiert und in die 
Spracherkennungseinrichtung 
geladen. AnschlieBend wird der 
gespeicherte akustische Wert 
<BismarkstraBe> in der 
Spracherkennungseinrichtung mit 
demVokabulardesStraBenlexikons 
verglichen und der StraBenname 
mit der groBten 

Erkennunaswahrscheinlichkeit 
ausgegeben. 


30 


"BismarkstraBe, ist das richtig?" 










"Ja n 


Da die erkannte BismarkstraBe 
eindeutig ist, kann auf weitere 
Abfragen verzichtet werden. 


35 


"Zielfuhrung programmiert auf 
'Reutlingen, BismarkstraBe'" 












■ * * 



40 Patentanspruche 

1 . Verfahren zur Spracheingabe einer Zieladresse in ein Zielfuhrungssystem im Echtzeitbetrieb, bei welchem einge- 
gebene SprachauBerungen eines Benutzers mittels einer Spracherkennungseinrichtung erkannt und gemaB ihrer 
Erkennungswahrscheinlichkeit klassifiziert werden und diejenige SprachauBerung mit der groBten Erkennungs- 

45 wahrscheinlichkeit als die eingegebene SprachauBerung identifiziert wird, wobei mindestens eine SprachauBe- 

rung ein zulassiges Sprachkommando ist, welches die diesem Sprachkommando zugeordneten Bedienfunktionen 
des Zielfuhrungssystems aktiviert, wobei alle zulassigen SprachauBerungen auf mindestens einer Datenbasis 
gespeichert sind, wobei wenigstens eine Bedienfunktion des Zielfuhrungssystems mindestens einen Eingabedia- 
log umfasst, wobei nach der Aktivierung der wenigstens einen Bedienfunktion des Zielfuhrungssystems in Abhan- 

so gigkeit des mindestens einen Eingabedialogs aus den auf mindestens einer Datenbasis gespeicherten zulassigen 

SprachauBerungen in Echtzeit mindestens ein Lexikon generiert und anschlieBend das mindestens eine Lexikon 
als Vokabular in die Spracherkennungseinrichtung geladen wird. 

2. Verfahren nach Anspruch 1 , wobei mindestens ein Lexikon aus den auf mindestens einer Datenbasis gespeicher- 
55 ten zulassigen SprachauBerungen in einem 'Off-Line-Editiermodus' generiert wird, wobei nach der Aktivierung der 

wenigstens einen Bedienfunktion des Zielfuhrungssystems in Abhangigkeit des mindestens einen Eingabedialogs 
das mindestens eine im 'Off-Line-Editiermodus' generierte Lexikon in Echtzeit als Vokabular in die Spracherken- 
nungseinrichtung geladen wird. 
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3. Verfahren nach Anspruch 1 Oder 2, wobei mindestens eine SprachauGerung ein Ortsnamen und/oder ein Stra- 
Gennamen ist, wobei alle zulassigen Ortsnamen in einer Zieldatei abgelegt sind und wobei fur wenigstens einen 
zulassigen Ortsnamen alle zulassigen StraGennamen in einer StraGenliste abgelegt sind. 

4. Verfahren nach Anspruch 1 , wobei die Spracherkennungseinrichtung mindestens einen sprecherunabhangigen 
Spracherkenner und mindestens einen sprecherabhangigen Zusatz-Spracherkenner umfasst, wobei abhangig von 
dem mindestens einen Eingabedialog der sprecherunabhangige Spracherkenner zur Erkennung von einzeln ge- 
sprochenen Ortsnamen und/oder StraGennamen und/oder von einzeln und/oder in Gruppen gesprochenen Buch- 
staben und/oder von Wortteiien verwendet wird und der sprecherabhangige Zusatz-Spracherkenner zur Erken- 
nung von mindestens einem gesprochenen Schlusselwort verwendet wird. 

5. Verfahren nach Anspruch 4, wobei dem mindestens einen Schlusselwort eine bestimmte Zieladresse zugeordnet 
wird, wobei das mindestens eine gesprochene Schlusselwort in einem personlichen Adressregister gespeichert 
wird und wobei aus dem personlichen Adressregister ein Namen-Lexikon generiert und in die Spracherkennunqs- 
einrichtung geladen wird. 

6. Verfahren nach Anspruch 2, wobei ein Grund-Lexikon, welches im 'Off-Line-Editiermodus' generiert wurde die 'p* 
groGten Orte eines Staates enthalt. 

7. Verfahren nach Anspruch 6, wobei das Grund-Lexikon in einem internen nicht fluchtigen Speicher des Zielfuh- 
rungssystems gespeichert ist. 

8. Verfahren nach Anspruch 1, wobei ein Umgebungs-Lexikon, welches in Echtzeit generiert wird, das 'a' Orte im 
Umkreis des aktuellen Fahrzeugstandortes enthalt, wobei das Umgebungs-Lexikon in regelmaGigen Abstanden 
aktualisiert wird. 

9. Verfahren nach Anspruch 8, wobei das Umgebungs-Lexikon in einem internen nicht fluchtigen Speicher des Ziel- 
fuhrungssystems gespeichert ist. 

1 0. Verfahren nach Anspruch 3, wobei nach der Aktivierung eines Eingabedialogs 'Zielort buchstabieren' ein Teilwort- 
Lexikon zur Buchstabiererkennung in die Spracherkennungseinrichtung geladen wird, anschlieGend der Benutzer 
emzelne Buchstaben und/oder Buchstabengruppen als SprachauGerungen eingibt, welche anschlieGend in der 
Spracherkennungseinrichtung mitdem Teilwort-Lexikon verglichen werden, wobei aus den erkannten Buchstaben 
und/oder Buchstabengruppen eine Hypothesenliste mit Worthypothesen gebildet wird, danach die ersten 'n' Wort- 
hypothesen mit der Zieldatei abgeglichen werden und aus dem Ergebnis des Abgleichs ein Ganzwort-Lexikon 
generiert und zur Ganzworterkennung in die Spracherkennungseinrichtung geladen wird, und anschlieGend ein 
gespeicherter akustischer Wert in der Spracherkennungseinrichtung zur Ganzworterkennung mit dem Ganzwort- 
Lexikon verglichen wird, wobei dieser akustische Wert aus einer als Ganzwort gesprochenen SprachauGerung 
vor dem Laden des Teilwort-Lexikons erzeugt wurde. 

11. Verfahren nach Anspruch 1, wobei nach dem Erkennen eines durch einen Eingabedialog 'Grobziel eingeben' ein- 
gegebenen 'Grobziels' durch das Zielfuhrungssystem in Echtzeit 'm' Orte im Umkreis urn den Ort 'Grobziel' be- 
rechnet werden und aus diesen 'm' Orten ein Feinziel-Lexikon generiert und in die Spracherkennungseinrichtung 
geladen wird. y 

12. Vorrichtung zum Ausfuhren des Verfahrens nach einem der vorhergehenden Anspruche, bei welcher ein Zielfuh- 
rungssystem (2) uber entsprechende Verbindungen (12) mit einem Sprachdialogsystem (1) verbunden ist, wobei 
abhangig von mindestens einer von einem Benutzer in eine Spracheingabeeinrichtung (5) gesprochene Sprach- 
auGerung, wenn die gesprochene SprachauGerung als ein zulassiges Sprachkommando von einer Spracherken- 
nungseinrichtung (7) erkannt wird, mittels einer Dialog- und Ablaufsteuerung (8) eine dem Sprachkommando zu- 
geordnete Bedienfunktion des Zielfuhrungssystems (2) aktiviert wird, wobei alle zulassigen SprachauGerungen 
auf mindestens einer Datenbasis (9; 4; 3) gespeichert sind, wobei mittels der Dialog- und Ablaufsteuerung (8) in 
Abhangigkeit von mindestens einem Eingabedialog, welcher Teil mindestens einer Bedienfunktion ist in Echtzeit 
wenigstens ein Lexikon aus den auf der mindestens einen Datenbasis (9; 4; 3) gespeicherten zulassigen Sprach- 
auGerungen generiert und als Vokabular in die Spracherkennungseinrichtung (7) geladen wird. 

13. Vorrichtung nach Anspruch 12, wobei mittels der Dialog- und Ablaufsteuerung (8) in Abhangigkeit von mindestens 
einem Eingabedialog mindestens ein im 'Off-Line-Editiermodus' generiertes Lexikon, welches auf mindestens ei- 
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ner Datenbasis (9; 4; 3) gespeichert ist, in Echtzeit als Vokabular in die Spracherkennungseinrichtung (7) geladen 
wird. 



5 Claims 

1. A method for speech input of a destination address into a navigation system in real time, in which entered speech 
statements of a user are recognized by a speech recognition device and classified according to their recognition 
probability and the speech statement with the greatest recognition probability is identified as the speech statement 

10 that was input, with at least one speech statement being an admissible speech command that activates the oper- 

ating functions of the navigation system associated with said speech command, all of the admissible speech state- 
ments being stored in at least one database, at least one operating function of the navigation system comprising 
at least one input dialogue, at least one lexicon being generated in real time following activation of the at least one 
operating function of the navigation system in dependence upon the at least one input dialogue from among the 

is admissible speech statements stored in at least one database, and the at least one lexicon being then loaded as 

a vocabulary into the speech recognition device. 

2. The method according to claim 1 , wherein at least one lexicon is generated from the admissible speech statements 
stored in at least one database in an "off-line editing mode", the at least one lexicon generated in the "off-line 

20 editing mode" is loaded in real time as the vocabulary into the speech recognition device after activation of the at 

least one operating function of the navigation system in dependence upon the at least one input dialogue. 

3. The method according to claim 1 or 2, wherein at least one speech statement is at least one of a place name and 
a street name, all admissible place names are stored in a destination file, and all admissible street names for at 

25 least one admissible place name are stored in a street list. 

4. The method according to claim 1, wherein the speech recognition device comprises at least one speaker-inde- 
pendent speech recognition engine and at least one speaker-dependent additional speech recognition engine, 
wherein, depending on the at least one input dialogue, the speaker-independent speech recognition engine for 

30 recognizing place names, street names, or letters spoken one at a time or in groups or parts of words is used, and 

the speaker-dependent additional speech recognition engine is used to recognize at least one spoken keyword. 

5. The method according to claim 4, wherein a particular destination address is assigned to the at least one keyword, 
the at least one spoken keyword is stored in a personal address list, and a name lexicon is generated from the 

35 personal address list and loaded into the speech recognition device. 

6. The method according to claim 2, wherein a basic lexicon generated in the "off-line editing mode" contains the "p" 
largest places in a state. 

40 7. The method according to claim 6, wherein the basic lexicon is stored in an internal nonvolatile memory of the 
navigation system. 

8. The method according to claim 1 , wherein an environment lexicon generated in real time contains "a" locations in 
an area of current vehicle location, with the environment lexicon being updated at regular intervals. 

45 

9. The method according to claim 8, wherein the environment lexicon is stored in an internal, nonvolatile memory of 
the navigation system. 

10. The method according to claim 3, wherein following activation of an input dialogue "spell destination location" a 
50 partial-word lexicon for letter recognition is loaded into the speech recognition device, the user then enters indi- 
vidual letters and/or letter groups as speech statements, which are subsequently compared in the speech recog- 
nition device with the partial-word lexicon, a hypothesis list with word hypotheses is formed from the recognized 
letters and/or letter groups, the first "n" word hypotheses are then compared with the destination file and a whole- 
word lexicon is generated from the result of the comparison, and is loaded into the speech recognition device for 

55 whole-word recognition, and a stored acoustic value in the speech recognition device is then compared with the 

whole-word lexicon for whole-word recognition, said acoustic value having been generated from a speech state- 
ment spoken as a whole word prior to the loading of the partial-word lexicon. 
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11. The method according to claim 1, wherein following recognition of a "coarse destination" entered by means of an 
input dialogue "enter coarse destination", the navigation system calculates in real time "m" locations in the area 
around the location "coarse destination", and from said "m" locations a fine destination lexicon is generated and 
loaded into the speech recognition device. 

12. An apparatus for carrying out the method according to any one of the preceding claims, in which a navigation 
system (2) is connected through corresponding connections (12) to a speech dialogue system (1), wherein de- 
pending on at least one speech statement spoken by a user into a speech input device (5) and when the spoken 
speech statement is recognized as an admissible speech command by a speech recognition device (7) an oper- 
ating function of the navigation system (2) associated with the speech command is activated by means of a dialogue 
and process control (8), wherein all admissible speech statements are stored in at least one database (9- 4- 3) 
wherein at least one lexicon is generated in real time from the admissible speech statements, which are stored in 
the at least one database (9; 4; 3), by means of the dialogue and process control (8) in dependence upon at least 
one input dialogue forming part of at least one operating function, and is loaded as vocabulary into the speech 
recognition device (7). 

1 3. The apparatus according to claim 1 2, wherein at least one lexicon which is generated in the "off-line editing mode" 
and stored in at least one database (9; 4; 3) is loaded in real time as vocabulary into the speech recognition device 
(7) by means of the dialogue and process control (8) in dependence upon at least one input dialogue 



Revendications 

1. Procede d'enregistrement vocal d'une adresse de destination dans un systeme de navigation exploite en temps 
reel, dans lequel des paroles enregistrees par un utilisateur sont reconnues a I'aide d'un systeme de reconnais- 
sance vocale et classifies en fonction de leur probability de reconnaissance et les paroles avec la plus grande 
probabilite de reconnaissance etant identifies en tant que la parole enregistree, au moins une parole etant un 
ordre vocal autorise qui active la fonction d'exploitation du systeme de navigation qui est associee a cet ordre 
vocal, toutes les paroles autorisees etant sauvegardees dans au moins une base de donnees, au moins une 
fonction d'exploitation du systeme de navigation comprenant au moins un dialogue d'entree, apres I'activation d'au 
moms la fonction d'exploitation du systeme de navigation en fonction d'au moins le dialogue d'entree au moins 
un dictionnaire etant genere en temps reel a partir des paroles autorisees sauvegardees dans au moins une base 
de donnees et au moins le dictionnaire etant charge ensuite en tant que vocabulaire dans le systeme de recon- 
naissance vocale. 

2. Procede selon la revendication 1 , dans lequel au moins un dictionnaire est genere en un "mode d'edition off line" 
a partir des paroles autorisees sauvegardees dans au moins une base de donnees, apres activation d'au moins 
la fonction d'exploitation du systeme de navigation, le dictionnaire genere en "mode d'edition off line" etant charge 
en temps reel en tant que vocabulaire dans le systeme de reconnaissance vocale, en fonction d'au moins le 
dialogue d'entree. 

3. Procede selon la revendication 1 ou 2, dans lequel au moins une parole est le nom d'une localite et/ou d'une rue 
tous les noms de localites autorises etant memorises dans un fichier de destinations et tous les noms de rue 
autonses pour au moins un nom de localite autorise etant memorises dans une liste des rues. 

4. Procede selon la revendication 1 , dans lequel le systeme de reconnaissance vocale comporte au moins un iden- 
tificateur vocal independant du locuteur et au moins un identif icateur vocal supplemental dependant du locuteur 
en fonction d'au moins le dialogue d'entree, I'identificateur vocal independant du locuteur etant utilise pour la 
reconnaissance de noms de localites et/ou de noms de rue prononces individuellement et/ou de caracteres et/ou 
de parties de mots prononcees individuellement et/ou par groupes et I'identificateur local supplemental depen- 
dant du locuteur etant utilise pour la reconnaissance d'au moins un mot-cle prononce. 

5. Procede selon la revendication 4, dans lequel une adresse de destination determinee est associee audit au moins 
un mot-cle, ledit au moins un mot-cle prononce etant sauvegarde dans un repertoire personnel et un dictionnaire 
de noms etant genere a partir du repertoire personnel et charge dans le systeme de reconnaissance vocale. 

6. Procede selon la revendication 2, dans lequel un dictionnaire de base qui est generee en "mode d'edition off line" 
contient les tt p° plus grandes localites d'un Etat. 
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7. Procede selon la revendication 6, dans lequel le dictionnaire de base est sauvegarde dans une memoire interne 
non volatile du systeme de navigation. 

8. Procede selon la revendication 1 , dans lequel un dictionnaire des environs, qui contient "a" localites situees dans 
les environs du lieu actuel ou se trouve le vehicule est genere en temps reel, le dictionnaire des environs etant 
mis a jour a intervalles reguliers. 

9. Procede selon la revendication 8, dans lequel le dictionnaire des environs est sauvegarde dans une memoire 
interne non volatile du systeme de navigation. 



10. Procede selon la revendication 3, dans lequel apres I'activation d'un dialogue d'entree "epeler la localite de des- 
tination", un dictionnaire de mots partiels pour la reconnaissance de I'epellation est charge dans le systeme de 
reconnaissance vocale, I'utilisateur enregistrant ensuite en tant que paroles des lettres individuelles et/ou des 
groupes de lettres qui sont ensuite compares dans le systeme de reconnaissance vocale avec le dictionnaire de 

'5 mots partiels, une liste d'hypotheses comportant des hypotheses de mots etant creee a partir des lettres reconnues 

et/ou des groupes de lettres reconnus, les °n" premieres hypotheses de mots etant ensuite deduites du fichier de 
destinations et un dictionnaire de mots entiers etant genere a partir du resultat de la deduction et charge dans le 
systeme de reconnaissance vocale pour la reconnaissance de mots entiers et une valeur acoustique sauvegardee 
dans le systeme de reconnaissance vocale etant ensuite comparee avec les dictionnaires de mots entiers pour 

20 la reconnaissance de mots entiers, cette valeur acoustique ayant ete generee a partir d'une parole prononcee en 

tant que mot entier, avant le chargement du dictionnaire de mots partiels. 

11. Procede selon la revendication 1 , dans lequel apres la reconnaissance d'une "destination grossiere" enregistree 
dans un dialogue d'entree "enregistrer destination grossiere", "m" localites situees dans les environs de la localite 

25 "destination grossiere" sont calculees en temps reel par le systeme de navigation et un dictionnaire des destinations 

precises etant genere a partir de ces "m" localites et charge dans le systeme de reconnaissance vocale. 

1 2. Dispositif pour realiser le procede selon Tune quelconque des revendications precedentes, dans lequel un systeme 
de navigation (2) est relie par I'intermediaire de connexions (12) correspondantes avec un systeme de dialogue 

30 vocal (1), dans lequel en fonction d'au moins une parole prononcee par un utilisateur dans un systeme d'enregis- 

trement vocal (5), des lors que la parole prononcee est reconnue en tant qu'ordre vocal autorise par un systeme 
de reconnaissance vocale (7), une fonction d'exploitation du systeme de navigation (2) qui est associee a cet ordre 
vocal est activee par un systeme de controle du dialogue ou du processus (8), toutes les paroles autorisees etant 
sauvegardees par le systeme de controle du dialogue ou du processus (8) dans au moins une base de donnees 

35 (9 ; 4 ; 3), au moins un dictionnaire etant genere en temps reel par le systeme de controle du dialogue ou du 

processus (8), a partir des paroles autorisees memorisees dans au moins la base de donnees (9 ; 4 ; 3) en fonction 
d'au moins un dialogue d'entree qui est un element d'au moins une fonction d'exploitation et charge en tant que 
vocabulaire dans le systeme de reconnaissance vocale (7). 

40 13. Dispositif selon la revendication 12, dans lequel au moins un dictionnaire genere en "mode d'edition off line" qui 
est sauvegarde dans au moins une base de donnees (9 ; 4 ; 3) est charge en temps reel en tant que vocabulaire 
dans le systeme de reconnaissance vocale (7) par le systeme de controle du dialogue ou du processus (8), en 
fonction d'au moins un dialogue d'entree. 
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